星空影视网

展开菜单

大模型 AI 扫地机器人 “翻车”:成功率仅 40%

大模型 AI 扫地机器人 “翻车”:成功率仅 40%
ai 实验室 andon labs 最近开展了一项引人关注的研究,旨在测试配备顶尖大模型的扫地机器人在执行基础家庭任务时的实际表现。实验中,研究人员要求这些机器人完成一系列复杂指令,例如“将黄油递给人”,这一任务包含多个步骤:跨房间移动、识别物品包装、追踪并定位移动中的人员、完成物品交付,并最终返回充电座。 然而实验结果令人意外——这些搭载先进AI系统的机器人在任务完成上的成功率远逊于人类。数据显示,Gemini 2.5 Pro 的成功率为40%,Claude Opus...

全球开源技术峰会 GOTC 2025 在北京顺利举行

全球开源技术峰会 GOTC 2025 在北京顺利举行
11月1日至2日,gotc 2025 全球开源技术峰会在北京圆满落幕。本次大会以“万源共振,智构未来”为主题,汇聚了来自世界各地的开源领域顶尖专家、企业代表及广大开发者,共同探讨人工智能与开源深度融合的技术趋势与生态构建。活动吸引了超过3000名现场参会者,线上直播观看人次突破500万。 在为期两天的密集议程中,峰会设立了十余个专题论坛,涵盖大模型应用、AI编程、Agentic AI、云原生AI、AIGC、具身智能等前沿方向,全面呈现了AI技术从理论探索到工程落地的完整...

美团 LongCat 大模型官方 App 发布,支持联网搜索、还可以发起语音通话

美团 LongCat 大模型官方 App 发布,支持联网搜索、还可以发起语音通话
美团 longcat 正式宣布其官方 ios 应用启动公测,定位为“ai智能助手”,致力于帮助用户应对工作与生活中的各类挑战。据悉,longcat 具备联网搜索能力,并已支持语音通话功能(视频通话功能即将上线,敬请期待)。 产品介绍:美团 LongCat 1.0 震撼发布!免费畅享全球前沿 AI 模型交互体验,响应更迅速、功能更强大,为你精准解答疑惑,全面助力高效生活与品质日常。 iOS 用户现可在 APP Store 搜索“LongCat”直接下载体验。 源码地址:...

昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地

昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地
= 百度智能云混合云携手昆仑芯与HAMi(由密瓜智能发起并主导的 CNCF 开源项目),正式发布基于昆仑芯 P800 的 XPU/vXPU 双模式算力调度解决方案。该方案已在某金融行业客户的昆仑芯集群中成功落地,为智能客服、营销辅助等十余种 AI 应用提供稳定且灵活的算力支持。客户可在同一集群内自由切换使用昆仑芯 P800 的整卡 XPU 资源与虚拟化 vXPU 资源,既满足多样化业务需求,又实现国产算力资源的高效利用。 1. XPU/vXPU 双模调度,全面释放...

MiniMax LLM 负责人确认:新模型 M2.1 即将推出

MiniMax LLM 负责人确认:新模型 M2.1 即将推出
MiniMax 大模型负责人 Pengyu Zhao 表示,为践行“Intelligence with Everyone”的使命,公司将持续推动模型开源,助力人工智能生态的繁荣。作为这一战略的重要一环,他透露全新模型 M2.1 即将发布。 在社交平台的交流中,针对用户关心的订阅服务上线时间,Pengyu Zhao 回应称将在一至两周内推出,敬请期待。 此前,MiniMax 于上月底正式开源了 M2 模型,该模型专为 Agent 应用与代码生成打造,在价格仅为 Cl...

中国成唯一下滑市场 苹果再失守 谁蚕食了份额

中国成唯一下滑市场 苹果再失守 谁蚕食了份额
上一财季业绩刚有所好转,苹果大中华区的营收便再次下滑。 2025财年第四财季,苹果大中华区营收同比下降3.6%,也成为全球唯一业绩下滑的市场。苹果CEO库克给出的原因是,主要是供应限制导致iPhone销量环比下降。 不过专家认为,苹果中国区营收下滑源于内外部双重压力。内部看,iPhone主力机型升级幅度有限,难以激发用户的换机欲望。iPhone Air发售延迟,也直接冲击第四财季销量;从外部看,面临本土品牌强势崛起与消费偏好变迁,华为的回归直接冲击了苹果在中国高端市场...

AI 编程工具 Qoder 将原生支持 JetBrains 系列 IDE

AI 编程工具 Qoder 将原生支持 JetBrains 系列 IDE
阿里 ai 编程工具 qoder 在社交平台上发布消息,宣布将于本周正式为 jetbrains 全家桶 ide(涵盖 intellij、pycharm、goland 等)带来原生集成支持。 本次升级将引入 Agent Mode、Inline Chat 以及智能代码建议等多项功能,致力于提升使用 Java、Rust、Go 等编程语言的开发者在 IDE 内的 AI 辅助开发体验。 Qoder 定位于面向真实软件工程场景的 Agentic 编程平台,深度对接 Claud...

为什么 AI 编程工具公司选择发布“速度优化”模型,而不是追求更高智能?

为什么 AI 编程工具公司选择发布“速度优化”模型,而不是追求更高智能?
知名AI编程工具厂商Cursor与Windsurf相继推出了各自主打“高速运行”的编程模型。对此,AI编程工具Cline的创始人发表了自己的观点: Cursor和Windsurf选择推出以速度为核心优势的模型,本质上是因为这条路比从零打造一个极致智能的基础模型(foundational model)要容易许多。你可以这样理解整个过程:直接基于开源的大模型如Qwen3,使用强化学习(RL)在其特定任务场景中进行微调。 将微调后的模型部署在Cerebras或其它专为推...

360 开源视觉语言对齐模型 FG-CLIP2

360 开源视觉语言对齐模型 FG-CLIP2
360 集团近期宣布开源其全新视觉语言对齐模型 fg-clip2。该模型在包括长短文本图文检索、目标检测等在内的29项权威公开基准测试中,全面超越了来自google的siglip 2以及meta的metaclip2。 据官方介绍,FG-CLIP2 在模型架构层面实现了三大核心突破:首先,采用层次化对齐结构,使模型能够模仿人类视觉系统,同时捕捉整体场景与局部细节,实现从“看见”到“看清”的质变。 其次,引入动态注意力机制,让模型可智能识别并聚焦图像中的关键区域,...

Kimi Linear 一作张宇:关于模型训练的一些感想

Kimi Linear 一作张宇:关于模型训练的一些感想
月之暗面发布了名为 “kimi linear” 的混合线性注意力架构,据称在短距离、长距离及强化学习(rl)等多种扩展场景中均优于传统全注意力方法。kimi linear 由 3 份 kimi delta attention(kda)和 1 份全局 mla 组成。kda 是对 gated deltanet 的改进,通过细粒度门控来压缩有限状态 rnn 的记忆。 近日,Kimi Linear 核心作者分享了关于他对于该项目的一些感想: 作者:yzhangcs 链接...