星空影视网

展开菜单

Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型

Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型
阿里通义qwen团队近日发布全新力作——qwen3-livetranslate-flash,这是一款基于大语言模型的高性能多语言实时音视频同声传译模型,具备高精度、低延迟与强鲁棒性的核心优势。 依托于Qwen3-Omni强大的基础模型能力,结合海量多模态数据及百万小时级音视频训练资源,Qwen3-LiveTranslate-Flash 成功实现了对18种主流语言的离线与实时双模式音视频翻译支持。 关键特性 广泛语言覆盖:支持中文、英文、法语、德语、俄语、意大...

PC版谷歌Play Games服务新功能 语音直接播放攻略

PC版谷歌Play Games服务新功能 语音直接播放攻略
谷歌近日宣布,其安卓游戏服务Google Play Games的PC版本正式上线。该平台允许用户在Windows设备上通过虚拟化技术运行安卓游戏,实现跨设备畅玩。目前,支持多平台同步的游戏库已收录超过20万款游戏。 此次发布的一大亮点是全新功能Sidekick。该功能以内置AI助手为核心,基于谷歌自主研发的Gemini大模型打造,能够为玩家实时生成当前游戏的攻略,并通过语音播报的方式直接提供帮助,提升游戏体验的便捷性与沉浸感。...

谷歌透露将开发Android PC!高通CEO:我亲眼见过、太不可思议了

谷歌透露将开发Android PC!高通CEO:我亲眼见过、太不可思议了
9月24日,在近期举行的骁龙峰会上,谷歌高级主管Rick Osterloh与高通首席执行官Amon一同亮相,透露了一个全新合作项目的进展,暗示一款运行Android系统的个人电脑正处于开发阶段。 Osterloh在对话中表示,这款未来设备将融合智能手机与传统PC的功能特点,或将采用一种全新的混合型操作系统架构。而高通CEO的现身,则强烈暗示该设备将搭载高通骁龙系列芯片。 Amon在现场评价道:“我亲眼见过这个项目,令人惊叹。它真正实现了移动设备与PC之间的融合梦想...

最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试

最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试
纽约大学斯特恩商学院联合金融科技企业goodfin发布的最新研究指出,当前顶尖的推理型人工智能模型,如gemini 2.5 pro与claude opus 4,仅需几分钟即可在未经额外训练的情况下顺利通过cfa三级考试。部分领先ai的表现准确率甚至显著超出该考试的合格标准。 相比之下,人类考生通常需要投入数百乃至上千小时的学习时间才能达到通过考试所需的水平。 此前,摩根大通与加拿大女王大学在2023年的一项研究中曾发现,尽管当时最先进的AI模型已能应对CFA一级和...

谷歌发布开源 AI 项目 Androidify,可生成个性化“安卓人”

谷歌发布开源 AI 项目 Androidify,可生成个性化“安卓人”
谷歌近日正式推出全新 ai 应用 androidify,用户只需上传自拍照或输入文字提示,即可通过 ai 技术打造专属的 android 机器人形象。目前该应用已同步登陆网页端及 google play 商店,面向公众免费下载。 据悉,Androidify 深度整合了 Gemini 和 Firebase AI Logic SDK,具备图像审核、自动描述生成以及个性化机器人创建等多项智能功能。 当用户提交照片后,系统将首先调用 Gemini 2.5 Flash 对图像进...

Zed 编辑器 AI 辅助编程功能改为“按 Token 用量收费”

Zed 编辑器 AI 辅助编程功能改为“按 Token 用量收费”
开源代码编辑器 zed 宣布对其 ai 辅助功能的计费模式进行重大调整,将从原有的“按 prompt 提交次数”计费,转向基于“token 实际用量”的新机制。此举旨在让费用结构更贴近实际资源消耗成本,同时为用户提供更高的使用灵活性。 主要变更内容 新的 Token 计费方案即日起适用于所有新用户;现有 Pro 订阅用户享有三个月的过渡期以适应变更。 免费用户将在 2025 年 10 月中旬正式切换至新计费体系。虽然不再限制 Prompt 提交次数,但编辑预测(...

谷歌 DeepMind 推出双 AI 机器人系统

谷歌 DeepMind 推出双 AI 机器人系统
谷歌DeepMind最新推出的Gemini Robotics项目,首次实现了让机器人在行动前具备“思考”能力的双模型协同系统。这一技术突破有望打破当前机器人仅能完成特定任务的瓶颈,推动其向更通用化方向发展。 尽管生成式AI已在文本、图像、音频和视频内容创作中广泛应用,如今这项技术正被延伸至机器人动作指令的生成领域。DeepMind研究团队强调,生成式AI对机器人学具有深远意义,因为它能够赋予机器人前所未有的通用性与适应能力。 目前大多数机器人面临的核心挑战是高度专...

谷歌 DeepMind 开放具身推理模型 Gemini Robotics-ER 1.5

谷歌 DeepMind 开放具身推理模型 Gemini Robotics-ER 1.5
谷歌推出了其首款面向广泛使用的机器人具身推理模型——gemini robotics-er 1.5,官方将其称为“机器人的高级大脑”。该模型在多项学术和内部基准测试中表现卓越,达到当前领先水平,现已通过google ai studio及gemini api预览版向开发者开放。 Gemini Robotics-ER 1.5基于强大的Gemini多模态基础模型构建,并针对物理环境中的交互需求进行了专门优化与微调。在保持原有通用推理能力的基础上,新增了四大关键能力:...

性价比搏击:Grok 4 Fast 推理成本直降 98%

性价比搏击:Grok 4 Fast 推理成本直降 98%
作为轻量化推理模型的重要突破,xAI于上周五正式推出其旗舰级模型的高效版本Grok 4 Fast。 该模型通过端到端强化学习实现智能密度的显著提升,在多项基准测试中性能与Grok 4持平。得益于推理过程中平均token消耗降低40%,此次升级大幅压缩了模型调用成本。 官方数据显示,单次推理任务的最低成本已降至此前的2%,这一数字足以撼动当前大模型市场的竞争格局。 端到端强化学习驱动 若用三个关键词概括Grok 4 Fast的核心优势,那便是AI搜索、超长上下文...

十年来首次重大更新:谷歌启用全新渐变色“G”形 Logo

十年来首次重大更新:谷歌启用全新渐变色“G”形 Logo
9 月 30 日消息,根据谷歌当地时间周一发布的声明,该公司正在采用全新的渐变色“g”标志作为其全球统一标识。这一设计最早于今年 5 月出现在安卓(android)与 ios 平台的谷歌应用中,接下来将逐步推广至所有服务和平台,成为谷歌近十年来首次重大的品牌视觉更新。 对比谷歌旧版 Logo(左)与新版 Logo(右)可以看出,自 2015 年启用的彩色“G”由红、黄、绿、蓝四种分离色块组成;而此次更新则将这四种颜色融合为流畅的渐变效果,并增强了色彩的饱和度,整体风...