11月24日,阿里巴巴旗下的ai助手“千问”app,在开启公测后的一周内,交出了一份惊人的成绩单。公测仅一周,其下载量便已强势突破1000万次,超越了chatgpt、sora、deepseek等一众前辈,成为史上增长最快的ai应用。
开源模型积淀深厚,已获硅谷认可
千问App的异军突起,离不开其背后强大的开源大模型——Qwen的深厚积淀。自2023年全面开源以来,Qwen系列模型的全球累计下载量已突破6亿次,其旗舰级模型Qwen3-Max,性能表现已跻身全球前三甲,超越...
生成式ai新创公司anthropic近日宣布,与美国科技巨头microsoft及nvidia达成一项重大策略联盟。根据协议,anthropic将获得来自microsoft与nvidia高达150亿美元的战略投资,并承诺未来采购金额可能突破300亿美元的azure云端运算资源。
据悉,Anthropic计划将其下一代人工智能模型直接部署于Microsoft Azure平台,同时将采用Nvidia最新推出的Grace Blackwell架构以及Vera Rubin AI...
anthropic 推出了其最新旗舰级模型 claude opus 4.5,重点提升了在工程能力、长周期任务处理以及智能代理(agent)执行效率方面的表现,旨在成为“软件开发、系统操作与自动化流程”领域中最强大的通用人工智能模型之一。
工程能力与性能全面跃升
在多个软件工程基准测试中表现卓越,尤其在复杂编码任务和长链条逻辑推理方面实现显著突破。
针对长时间对话、多步骤工具调用及代理式任务执行进行了深度优化,能够稳定支持持续数小时乃至跨日运行的复杂...
在大模型“下饺子”般密集发布的近期,继gemini 3 pro之后,anthropic公司的claude opus 4.5,也于近日深夜,正式发布。
Anthropic官方宣称,Opus 4.5在编程、构建Agent(智能体)以及操控电脑等“系统级任务”上,依然保持着全球顶尖的水平。
编程测试碾压人类,代码质量全面升级
从官方和测试者的反馈来看,Claude Opus 4.5对“模糊需求”的理解能力,得到了显著的提升。
在业界权威的软件工程测试SWE-Bench...
如果你还在依赖“随机提示词”让 ai 写代码,那么过去两年的实践早已证明:幻觉频发、反复返工、技术债堆积,最终只会让效率提升化为泡影。
在 GOTC 2025 上,腾讯资深技术产品专家汪晟杰分享了一套更系统化的演进路径——将自然语言需求转化为可执行、可验证、可迭代的“规约”,让 AI 不再只是临时写代码的工具,而是像真正同事一样持续理解上下文,参与协作开发。
这场演讲并未推广任何特定工具,而是浓缩了从 SpecKit、OpenSpec 到 CodeBuddy 等开...
据悉,SpatialBench是近年来备受关注的第三方空间推理评测榜单,专注于评估多模态大模型在空间结构、路径规划及几何理解等方面的综合能力,被AI领域广泛视为衡量“具身智能”发展水平的重要新兴标准之一。该测试不仅考察模型的知识储备,更重视其在二维与三维环境中对抽象概念的“感知”与操作能力,这对于机器人、自动驾驶等实际应用场景至关重要。
最新榜单显示,阿里通义千问系列的视觉语言模型Qwen3-VL-235B和Qwen2.5-VL-72B分别以13.5分和12.9分的...
近日,在衡量多模态模型空间推理能力的关键基准测试spatialbench的最新榜单中,来自阿里巴巴的视觉理解模型取得了瞩目的成绩。其旗下的千问qwen3-vl和qwen2.5-vl模型,成功包揽了榜单的前两名,其表现超越了包括谷歌gemini 3、openai gpt-5.1以及claude sonnet 4.5在内的所有国际顶尖模型。
具体的榜单数据显示,千问Qwen3-VL-235B和Qwen2.5-VL-72B的得分分别为13.5分和12.9分,而作为对比,Gem...
据报道,amazon已通过一份发布在公司内部新闻平台的备忘录,建议其工程师避免使用第三方ai编程工具,转而采用公司自主研发的ai编码服务kiro。该消息已获得amazon发言人确认。
备忘录中提到,Amazon将继续为当前已在使用的第三方工具提供支持,但未来将不再扩展对其他外部AI开发服务的支持。这一政策实际上排除了员工使用OpenAI的Codex、Anthropic的Claude Code以及初创企业Cursor等主流AI编程工具的可能性。
尽管Amazon已向...
美国人工智能新创Anthropic正式发布其最新一代大型语言模型Claude Opus 4.5,强调在程式开发、AI代理运作与电脑操作等复杂任务中达到业界领先水准,并同步深化与Chrome浏览器、Excel试算表等常用工具的整合能力。
该模型现已于Anthropic自家平台、API接口及三大主流云端服务平台上线,开发者可透过代号「claude-opus-4-5-20251101」进行调用。在定价策略上,每百万输入token收费5美元、输出token为25美元,相较前...
美国总统川普于24日签署一项行政命令,正式推出名为「创世纪任务」(genesis mission)的国家级人工智慧(ai)加速计划,旨在提升美国在全球ai领域的竞争力,并巩固其在科学研究上的领导地位。
根据白宫公布的命令内容,能源部将负责建立一个整合型AI平台,整合全国的国家超级电脑、联邦科学数据库以及各类研究设施资源,以推动核融合、半导体制造等前沿科技的快速发展。该平台将在未来九个月内,针对能源部于六十天内所提出的二十项关键科学挑战,实现至少一项初步运行成果。...