阿里巴巴通义实验室推出了全新的端到端语音识别大模型 funaudio-asr。该模型引入创新的 context 模块,显著提升了在高噪声环境下的识别稳定性,将幻觉率从 78.5% 大幅下降至 10.7%,降幅接近 70%。
FunAudio-ASR 基于数千万小时的真实音频数据训练而成,并深度融合了大语言模型的语义理解能力,在远场、嘈杂背景及多说话人等复杂场景中表现出色,性能超越 Seed-ASR、KimiAudio-8B 等当前主流系统。
为满足不同应用场景需求...
9月16日,第六届中国质量大会在江苏南京拉开帷幕。tcl科技凭借“极致、领先、协同”的质量管理模式,荣膺第五届中国质量奖,成为广东省及粤港澳大湾区唯一获此殊荣的企业。
尤为引人注目的是,TCL科技首次申报即从全国500余家参评单位中脱颖而出,成功斩获这一国家级奖项,充分彰显了评审专家对其质量管理体系的高度肯定与认可。
设立国家质量奖励制度是全球通行做法。中国质量奖作为我国质量领域的最高荣誉,自2012年设立以来,已成功举办五届评选表彰活动。该奖项旨在嘉奖在质量管理...
阿里巴巴通义实验室近日正式发布了 funaudio-asr —— 一款面向企业级应用场景的端到端语音识别大模型。该模型不仅具备出色的通用语音识别精度,更通过独创的 context 增强模块,有效应对工业落地中的“语义幻觉”、“多语种混杂”等核心挑战。
其核心技术亮点在于引入了创新性的“Context 模块”,显著提升了在高噪声环境下的识别稳定性与准确性。实测数据显示,模型的幻觉率从原先的78.5%大幅下降至10.7%,降幅接近70%,为行业树立了新的性能标杆。这一突破尤...
9月17日,消息指出,在与amd持续激烈的市场竞争中,intel近年来在pc领域被锐龙系列超越,服务器市场也因amd epyc处理器的强势表现而丢失了不少份额。不过,近期形势似乎有所好转,intel迎来了一丝喘息之机。
据调研机构KeyBanc分析师发布的最新报告,Intel服务器处理器在各大云平台的部署数量正稳步上升,尤其是新一代Granite Rapids架构的至强处理器展现出显著性能提升,为公司提供了有力支撑。
过去8个月中,Intel处理器在云端的部署量环比增...
市场调研机构omdia发布《中国企业genai(生成式ai)采用格局,2025h1》报告指出,超7成的《财富》中国500强企业已采用genai。报告称,当前中国genai正处于高速渗透和规模化应用阶段,本土云厂商提供的全栈ai服务以及中国开源模型,将成为市场增长的核心驱动力。
据了解,以大模型为核心的生成式AI正加速进入中国的千行百业。报告显示,对于中国 500 强企业在AI基础设施、大模型、开发平台和AI应用的实际情况,74.6% 已经应用或部署生成式AI,其中,...
近段时间以来,围绕DeepSeek的讨论持续不断,诸如下载量下滑、用户规模收缩等传闻频现,引发外界对其技术路径与发展前景的种种猜测。然而,这些表象背后,实则反映出人们对大模型发展规律理解的不足。
在人工智能的新阶段,衡量大模型的价值早已不能局限于使用频率或流量规模,而应着眼于技术积累的深度与生态协同的广度。唯有坚持对核心技术的长期投入和战略定力,方能在大模型时代真正站稳脚跟。
从“流量为王”转向“技术为本”,AI时代的竞争逻辑正在重塑。互联网产品往往信奉“快鱼吃慢...
阿里云正式宣布通义万相全新动作生成模型 wan2.2-animate 开源。该模型可驱动人物、动漫角色及动物图像实现动态化,广泛适用于短视频制作、舞蹈模板生成、动画创作等多个场景。开发者可通过 github、huggingface 和魔搭社区获取模型与代码,也可通过阿里云百炼平台调用 api,或直接在通义万相官网体验功能。
Wan2.2-Animate 是在先前开源的 Animate Anyone 模型基础上全面升级而来,在角色一致性、画面生成质量等方面实现了显著提升,...
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型诞生,该模型现已全面开源。qwen3-omni 能够处理文本、图像、音频和视频等多样化输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应。
在多个应用场景中,Qwen3-Omni 展现出卓越的跨模态能力。其核心技术依托于早期以文本为中心的预训练策略与混合多模态训练方法,从而构建出强大的多模态理解力。尤其在音频与视频任务中表现突出,同时在文本和图像处理方面也维持了...
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型的诞生,该模型现已全面开源。qwen3-omni 能够无缝处理文本、图像、音频和视频等多种输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应与高效反馈。
在多项跨模态任务中,Qwen3-Omni 展现出了卓越的性能表现。依托早期以文本为中心的预训练策略以及混合多模态联合训练机制,模型在保持文本与图像处理高水准的同时,在音频和视频理解方面尤为突出。根据涵盖36项音...
近日,阿里云重磅宣布通义万相全新动作生成模型 wan2.2-animate 正式开源,此举有望为短视频创作、舞蹈模板生成以及动漫制作等行业注入全新动力。开发者和创作者可通过 github、huggingface 及魔搭社区免费获取该模型及其完整代码。同时,用户还能通过阿里云百炼平台调用其 api,或直接访问通义万相官网在线体验模型的强大能力。
Wan2.2-Animate 是在前代模型 Animate Anyone 的基础上实现全面进化的成果,在人物一致性、画面清晰...