星空影视网

展开菜单

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash
阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出,还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言,展现出强大的语言适应能力。 在性能表现上,Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度,达到当前最先进的SOTA水平。同时,官方已同步推出API接口、在线D...

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型的诞生,该模型现已全面开源。qwen3-omni 能够无缝处理文本、图像、音频和视频等多种输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应与高效反馈。 在多项跨模态任务中,Qwen3-Omni 展现出了卓越的性能表现。依托早期以文本为中心的预训练策略以及混合多模态联合训练机制,模型在保持文本与图像处理高水准的同时,在音频和视频理解方面尤为突出。根据涵盖36项音...

告别P图烦恼!阿里Qwen-Image多图像编辑功能一键合成专业级广告大片

告别P图烦恼!阿里Qwen-Image多图像编辑功能一键合成专业级广告大片
aibase报道 - 阿里巴巴旗下ai图像处理工具qwen-image近期推出重磅功能更新,最受关注的是全新上线的多图编辑能力,为电商与数字营销领域提供了颠覆性的内容创作方案。 多场景融合编辑实现突破 最新版本Qwen-Image-Edit-2509现已支持多种图像协同编辑模式,涵盖人物+人物、人物+商品、人物+背景等多样化组合方式。用户可便捷地合成合影、构建场景画面或打造高水准的产品宣传图,全面适配电商平台展示与广告推广的复杂需求。 根据官方发布的实际演示效果,该工...

华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡

华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡
在刚刚落幕的华为全联接大会上,华为技术有限公司携手浙江大学共同发布了国内首款基于昇腾千卡算力平台打造的基础大模型——DeepSeek-R1-Safe。该模型聚焦当前人工智能领域中的安全与性能难题,标志着我国在AI安全技术研发方面迈出了关键一步。 ![图片](https://example.com/image1.jpg) 浙江大学计算机科学与技术学院院长任奎现场深入解读了该模型的技术亮点。他表示,DeepSeek-R1-Safe 采用了一套完整的安全后训练框架,涵盖高质量安...

Qwen3-Omni 即将登场:端侧跨模态模型再升级,PR 已提交 Transformers 库

Qwen3-Omni 即将登场:端侧跨模态模型再升级,PR 已提交 Transformers 库
阿里云今日正式发布并开源了其全新的 qwen3-omni、qwen3-tts,以及对标谷歌 nano banana 图像编辑工具的 qwen-image-edit-2509。 其中,Qwen3-Omni 作为业界首个原生端到端全模态 AI 模型,能够同时处理文本、图像、音频和视频等多种输入类型,并支持通过文本或自然语音进行实时流式输出,有效解决了传统多模态模型在不同能力间难以兼顾的难题。该模型基于“思考者–表达者”双轨架构设计,结合 MoE(专家混合)结构与 AuT...

阿里通义开源 Qwen3-ASR-Toolkit,音视频转录 Python 命令行工具

阿里通义开源 Qwen3-ASR-Toolkit,音视频转录 Python 命令行工具
阿里通义Qwen团队近日发布了一款开源的Python命令行工具——Qwen3-ASR-Toolkit,旨在突破Qwen3-ASR-Flash API对音频时长限制在3分钟内的瓶颈,支持对小时级音视频内容进行高效转录。 作为通义千问系列最新推出的语音识别模型,Qwen3-ASR-Flash依托强大的Qwen3基座模型,结合海量多模态数据及高达千万小时级别的ASR训练数据,具备卓越的语音理解能力。 新推出的Qwen3-ASR-Toolkit集成了VAD(Voice A...

阿里通义开源 Qwen3Guard,专为安全防护设计的护栏模型

阿里通义开源 Qwen3Guard,专为安全防护设计的护栏模型
阿里通义qwen推出了专为全球实时ai安全打造的开源qwen3guard审核模型系列,支持多达119种语言,并提供三种参数规模以满足多样化部署需求。 作为Qwen家族中首款专注于安全防护的护栏模型,Qwen3Guard基于强大的Qwen3基础架构构建,并针对安全分类任务进行了深度微调,致力于在各类人工智能交互场景中提供精准、可靠的安全保障。无论是用户输入内容,还是模型生成的回复,Qwen3Guard均可高效识别潜在风险,并输出细粒度的风险等级与类别标签,助力实现更安全、...

Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型

Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型
阿里通义qwen团队近日发布全新力作——qwen3-livetranslate-flash,这是一款基于大语言模型的高性能多语言实时音视频同声传译模型,具备高精度、低延迟与强鲁棒性的核心优势。 依托于Qwen3-Omni强大的基础模型能力,结合海量多模态数据及百万小时级音视频训练资源,Qwen3-LiveTranslate-Flash 成功实现了对18种主流语言的离线与实时双模式音视频翻译支持。 关键特性 广泛语言覆盖:支持中文、英文、法语、德语、俄语、意大...

阿里通义发布 Qwen3-Max,其迄今为止规模最大、能力最强的模型

阿里通义发布 Qwen3-Max,其迄今为止规模最大、能力最强的模型
阿里通义qwen团队推出了迄今为止规模最庞大、性能最强大的qwen3-max模型,涵盖base、instruct和thinking三个变体。 其中,Qwen3-Max-Instruct正式版已在代码生成与智能体任务中展现出卓越能力,而Qwen3-Max-Thinking虽仍处于训练阶段,但已表现出惊人的推理潜力。目前,Qwen3-Max-Instruct已正式上线Qwen Chat平台,并通过阿里云百炼提供API服务。 Qwen3-Max-Base作为该系列的基础模型...

Qwen3-Coder Plus 更新发布,支持项目级代码理解

Qwen3-Coder Plus 更新发布,支持项目级代码理解
阿里通义团队旗下开源 agentic 编程模型 qwen3-coder plus 迎来重磅更新,能力全面跃升: 经 Agentic Coding 联合训练优化后,TerminalBench 成绩显著提升,在 OpenRouter 平台曾跻身全球第二受欢迎的 Coder 模型行列(紧随 Claude Sonnet 4 之后); 全面支持 256K 上下文长度,具备一次性解析与修复完整项目级代码库的能力; 推理更高效、Token 使用更节省、安全机制更完善。 本次升级五...