google deepmind发布了新一代多模态智能体sima2,基于gemini2.5flash-lite模型构建,其任务完成成功率相较前代sima1提升近一倍。该智能体具备在未曾接触的新环境中执行复杂指令的能力,并拥有自我优化机制。目前版本以研究预览形式推出,核心目标是验证实现通用机器人与agi所需的关键能力——高层级的世界理解与推理。
SIMA2延续了使用数百小时游戏视频进行预训练的策略,但首次引入自生成数据闭环系统:当进入新场景时,系统会调用独立的Gemin...
Google持续强化其AI笔记工具NotebookLM,最新宣布整合Gemini系列中的高阶代理型AI功能「Deep Research」,让使用者能在NotebookLM内启动更全面且深入的主题探索。此功能预计将在一週内向所有用户全面开放。
此次更新象征Google在研究导向AI产品上的进一步整合。Deep Research此前已可与多项Workspace应用如Gmail、Drive和Google Chat协同运作,透过授权机制,AI能从电子邮件、云端档案及聊天记录...
Google DeepMind近日正式推出全新多模态AI代理SIMA 2,首次深度融合Gemini大模型的语言理解、逻辑推理与视觉感知能力,并在《山羊模拟器3》等开放世界游戏中实现跨环境的自主学习与任务执行,标志着人工智能向AGI(通用人工智能)迈进的关键一步。
此次发布的SIMA 2基于Google Gemini多模态架构构建,其核心突破在于能够精准解析人类以自然语言下达的复杂指令。例如面对「先前往东边山顶寻找红旗,记录石碑上的符号,再返回营地开启宝箱」这样的任务...
qwen code 是一款专为 ai 编程打造的命令行工具(cli),基于 gemini cli 修改而来,针对 qwen3‑coder 系列模型强化了解析能力和工具生态支持。
最新版本 Qwen Code v0.2.1 正式上线,聚焦提升开发者体验与项目工程效率,带来多项关键功能升级。
本次更新的核心亮点如下:
免费网络搜索能力:支持多数据源检索,Qwen OAuth 用户每日可享受 2000 次免费调用额度;
更精准的代码编辑:改进代码修改逻辑,引入模...
北京时间11月18日,就在谷歌即将发布其新一代gemini模型的前夕,马斯克旗下的人工智能公司xai,突然发布了其最新的大语言模型grok 4.1,正面硬刚谷歌与openai。官方宣称,这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示,用户将会注意到其在速度和质量上的显著提升。
登顶大模型竞技场排行榜
根据大模型竞技场(LMArena)最新公布的文本能力排行榜,Grok 4.1的两个版本已成功占据了榜首位置。其中,具备深度思考能力的Gro...
“9.11和9.9,究竟谁更大?”——这道看似简单的小学数学题,却曾难倒了一众海内外的ai大模型,成为了检验大模型常识与逻辑推理能力的一块“试金石”。
今日,记者在测试阿里巴巴最新公测的“千问”APP时,意外发现,此前曾答对该问题的千问,这次竟也“翻车”了。
先答错,再自我纠错
当记者提问:“数字9.9和9.11谁大?”时,千问APP给出的第一反应竟是:“9.11更大”。
然而,有趣的是,在随后的详细解析中,千问又通过正确的逻辑拆解,得出了“9.9大于9.11”的结...
昆仑万维近日推出全新轻量级多模态智能体 skywork r1v4-lite,该模型集成了视觉操作、逻辑推理与任务规划能力,具备在单一架构下统一实现主动图像处理、外部工具调用以及多模态深度研究的综合功能。
不同于传统仅能“看图说话”的多模态模型,Skywork R1V4-Lite 能在真实应用场景中通过随手拍摄的照片完成复杂操作:自动旋转图像以判断空间方位、多次放大识别模糊文字内容、绘制辅助线验证几何关系、跨模态检索定位实际地理位置等。用户无需精心设计提示词或提供额外信息...
google deepmind 联合 google research 推出全新气象预测 ai 模型 weathernext 2,成为当前业界领先的天气预报系统,支持最高逐小时精度的预报,推理速度相较前代模型提升达 8 倍。
该模型采用创新的“函数生成网络”(Function Generating Network, FGN)架构,仅需一次输入即可输出数百种符合物理规律的可能天气情景,实现高效概率预测。在单个 TPU 上完成一次完整预测耗时不足一分钟,大幅提升了实时性与...
近日,根据苹果开发者文档的最新信息,在ios 26.2系统中,苹果首次为日本地区的iphone用户开放了侧边按钮功能的自定义权限,允许将默认语音助手从siri更换为第三方应用,例如alexa、gemini等。这一更新被视为苹果在特定市场对系统封闭策略的一次有限突破。
过去,长按iPhone侧边按钮只能唤醒Siri,且该操作无法更改。但在iOS 26.2中,日本用户可在“设置”中选择其他语音助手作为侧边按钮的默认响应程序。不过,该功能的实现依赖于第三方应用主动进行技术...
google deepmind于2025年11月发布新一代ai天气预测模型weathernext 2,採用自家研发的功能生成网路(functional generative network,fgn)架构,运算效率较旧式数值模式提升八倍,并在预报準确度、预测时效与产业应用面等层面皆有重大突破。
这款模型以大量历史气象资料训练,能于一分钟内利用单一TPU,推算出上百种天气可能情境,WeatherNext 2涵盖温度、风速、气压与降水等多元预测指标,并可提供精细到小时级别...