星空影视网

展开菜单

声网 AI 模型评测平台新增多项评测维度 模型选择数量提升3倍

声网 AI 模型评测平台新增多项评测维度 模型选择数量提升3倍
声网 ai 模型评测平台(对话式)2.0 版本近日正式发布,评测能力迎来全面升级:测试覆盖区域扩展至10个全球核心城市,遍及各大洲;可选模型数量增长3倍;asr 模型新增支持9种语言的词错误率评估;tts 模型则在中英文场景下引入词错误率与字母数字性能对比功能,同时开放用户自定义输入中英文文本,一键生成语音效果。 自上线以来,AI 模型评测平台(对话式)凭借对 ASR+LLM+TTS 主流服务商延迟数据的横向测评能力,广受开发者欢迎。此次2.0版本新增多项衡量对话式AI...

从“互联网+”到“人工智能+”:应用端成领头羊,混合式AI战略卡位万亿赛道

从“互联网+”到“人工智能+”:应用端成领头羊,混合式AI战略卡位万亿赛道
9月18日,中银证券发布研究报告指出,在大模型技术能力的强力支撑下,ai应用正迈入商业化加速期。2025年第一季度至第二季度,gemini与豆包等主流大模型的token日均销量实现显著增长,海外及港股市场中ai多模态、ai企业服务、ai医疗、ai编程等垂直领域已逐步进入业绩兑现阶段。作为中国少数具备全栈式ai产品、解决方案与服务能力的科技领军企业,联想正迎来“ai+”战略价值被重新评估的关键窗口。 同日,东吴证券也于17日发布研报认为,我国在AI应用发展方面拥有得天独厚...

谷歌深度学习专家 Dustin Tran 跳槽至 xAI

谷歌深度学习专家 Dustin Tran 跳槽至 xAI
AI领域迎来重磅人事变动:谷歌DeepMind核心人物Dustin Tran正式宣布加入埃隆·马斯克旗下的xAI团队,将专注于新一代Grok模型的研发。该消息一经其本人在社交平台发布,便迅速获得马斯克的转发确认,标志着这一关键人才引进已成事实。 作为Gemini项目自 inception 以来的核心架构师之一,Tran在该项目发展的多个里程碑阶段均起到了决定性作用。教育背景方面,他于2014年从加州大学伯克利分校取得数学与统计学士学位,随后进入哈佛大学攻读统计学博士...

字节跳动推出多语言翻译模型 Doubao-Seed-Translation

字节跳动推出多语言翻译模型 Doubao-Seed-Translation
近日,字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation,该模型支持数十种语言之间的互译。 据官方介绍,Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准,而在通用多语言翻译能力方面,性能达到甚至超越 GPT-4o 与 Gemini-2.5-Pro,能够精准满足办公、娱乐等多种应用场景下的翻译需求。 模型定价详情 输入 (元/百万 token)...

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型诞生,该模型现已全面开源。qwen3-omni 能够处理文本、图像、音频和视频等多样化输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应。 在多个应用场景中,Qwen3-Omni 展现出卓越的跨模态能力。其核心技术依托于早期以文本为中心的预训练策略与混合多模态训练方法,从而构建出强大的多模态理解力。尤其在音频与视频任务中表现突出,同时在文本和图像处理方面也维持了...

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型的诞生,该模型现已全面开源。qwen3-omni 能够无缝处理文本、图像、音频和视频等多种输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应与高效反馈。 在多项跨模态任务中,Qwen3-Omni 展现出了卓越的性能表现。依托早期以文本为中心的预训练策略以及混合多模态联合训练机制,模型在保持文本与图像处理高水准的同时,在音频和视频理解方面尤为突出。根据涵盖36项音...

字节跳动推出豆包翻译大模型:28种语言互译,比肩GPT-4o

字节跳动推出豆包翻译大模型:28种语言互译,比肩GPT-4o
字节跳动旗下的火山引擎近期推出了全新的通用翻译大模型——doubao-seed-translation(豆包翻译模型),具备高达28种语言之间的互译功能。 据官方介绍,该模型在翻译质量上已达到甚至部分超越当前主流的GPT-4o与Gemini-2.5-Pro等先进模型。在定价方面,豆包翻译模型同样展现出显著优势,输入价格低至每百万字符1.20元,输出为每百万字符3.60元。 更多具体定价详情可参考火山引擎官方文档:https://www.php.cn/link/e47d...

谷歌宣布Gemini定制助手Gems现已可供分享

谷歌宣布Gemini定制助手Gems现已可供分享
谷歌在本周四宣布,其个性化AI助手Gemini Gems现已支持共享功能。这项能力最初作为付费订阅服务的一项权益推出,允许用户构建专为特定用途定制的AI聊天机器人,例如学习辅导、文案润色或编程协助。 现在,用户可以像分享Google Drive中的文件一样,便捷地将自己创建的Gems发送给朋友、家人或团队成员。谷歌表示,此举意在提升这些定制化AI工具的可访问性,并减少重复开发相似助手的情况。举例来说,若一个项目团队中的多名成员都需要类似的Gem,他们可以直接共用同一...

​谷歌 Chrome 浏览器新增 AI 功能,网民该如何应对?

​谷歌 Chrome 浏览器新增 AI 功能,网民该如何应对?
谷歌近日宣布,chrome 浏览器将经历一次前所未有的重大更新,核心内容是引入多项 ai 驱动功能,旨在全面提升用户的浏览体验。 本次升级将从今日起逐步向美国地区的 macOS 与 Windows 用户推送,优先面向使用英语语言设置的用户开放。谷歌产品副总裁 Mike Torres 指出,此次变革的关键在于“Gemini 深度整合”。用户将在浏览器中看到全新的 Gemini 按钮,点击后可获取网页内容的 AI 简要解读,快速汇总多个打开标签页的信息,回顾浏览历史,并无缝...

Google 宣布 Gemini 将登陆电视:不仅能帮你找片,还能辅导功课

Google 宣布 Gemini 将登陆电视:不仅能帮你找片,还能辅导功课
【aibase 报道】 google 于本周一宣布,其人工智能助手 gemini 即将登陆 google tv 平台,为电视用户带来全新的自然语言对话体验。此举将使 gemini 的服务范围扩展至超过3亿台活跃的 google tv 及其他搭载 android tv os 的设备,极大地拓宽了其应用场景。 Gemini 的电视端功能不仅限于娱乐,还兼顾了多种家庭生活需求。用户可利用 Gemini 解决“看什么”的难题,例如帮助不同兴趣的家庭成员协商出共同喜欢的节目,...