星空影视网

展开菜单

Notion3.0AI 代理爆出严重漏洞,恶意 PDF 可诱导其泄露敏感数据

Notion3.0AI 代理爆出严重漏洞,恶意 PDF 可诱导其泄露敏感数据
随着 Notion3.0 的推出,其搭载的全新自主 AI 代理功能引发了广泛关注。该功能被设计用于自动化执行各类任务,例如撰写文档、更新数据库以及优化工作流程管理。然而,网络安全企业 CodeIntegrity 最近发布的一份研究报告指出,这些 AI 代理存在严重安全隐患——攻击者可利用恶意文件(如 PDF)诱使代理绕过安全机制,进而窃取敏感信息。 这一漏洞的根源在于 AI 代理所具备的“致命三重组合”:大型语言模型(LLM)、对系统工具的访问权限,以及长期记忆能力...

Qwen3-Coder Plus 更新发布,支持项目级代码理解

Qwen3-Coder Plus 更新发布,支持项目级代码理解
阿里通义团队旗下开源 agentic 编程模型 qwen3-coder plus 迎来重磅更新,能力全面跃升: 经 Agentic Coding 联合训练优化后,TerminalBench 成绩显著提升,在 OpenRouter 平台曾跻身全球第二受欢迎的 Coder 模型行列(紧随 Claude Sonnet 4 之后); 全面支持 256K 上下文长度,具备一次性解析与修复完整项目级代码库的能力; 推理更高效、Token 使用更节省、安全机制更完善。 本次升级五...

最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试

最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试
纽约大学斯特恩商学院联合金融科技企业goodfin发布的最新研究指出,当前顶尖的推理型人工智能模型,如gemini 2.5 pro与claude opus 4,仅需几分钟即可在未经额外训练的情况下顺利通过cfa三级考试。部分领先ai的表现准确率甚至显著超出该考试的合格标准。 相比之下,人类考生通常需要投入数百乃至上千小时的学习时间才能达到通过考试所需的水平。 此前,摩根大通与加拿大女王大学在2023年的一项研究中曾发现,尽管当时最先进的AI模型已能应对CFA一级和...

微软和 Anthropic 合作,Microsoft 365 Copilot 集成 Claude 模型

微软和 Anthropic 合作,Microsoft 365 Copilot 集成 Claude 模型
微软近日宣布,已将 Anthropic 公司的 Claude 系列大模型接入 Microsoft 365 Copilot。此次集成将率先在“研究助手(Researcher)”功能以及 Microsoft Copilot Studio 中构建 AI 智能体时投入使用。 尽管 Microsoft 365 Copilot 的核心仍将由 OpenAI 最新发布的模型驱动,但用户现在拥有了更多选择,可按需切换至 Anthropic 提供的模型。 其中,Anthropic...

苹果 App Intents 框架将与 MCP 进行系统级整合

苹果 App Intents 框架将与 MCP 进行系统级整合
据 9to5Mac 报道,在最新发布的 macOS Tahoe 26.1、iOS 26.1 以及 iPadOS 26.1 开发者预览版中,系统代码透露出苹果正着手为引入 MCP(Model Context Protocol)协议做准备。 MCP 是由 Anthropic 提出的一项开放标准,目标是为各类 AI 系统提供一个统一的接入方式,使其能够安全地与第三方应用及服务进行交互。目前,Notion、Zapier、Figma 和 Salesforce 等多家知名企业已...

马斯克的 Grok 聊天机器人以超低价赢得美国政府合约

马斯克的 Grok 聊天机器人以超低价赢得美国政府合约
埃隆・马斯克旗下的 xAI 公司近日宣布,已与美国联邦政府达成一项重要协议:其开发的人工智能聊天机器人 Grok 将以极低的价格向联邦机构提供服务。 根据与美国总务管理局签订的合同,各联邦部门在未来一年半内使用 Grok,每单位服务费用仅为42美分,远低于1美元的市场主流定价。这一价格显著低于目前在政府市场占据主导地位的 OpenAI 和 Anthropic 所提供的 ChatGPT 与 Claude 服务,这两家公司的年费标准均为每用户1美元。如此明显的价格优势,...

OpenAI 最新测试:GPT-5 与 Claude 在部分工作中可媲美人类专家

OpenAI 最新测试:GPT-5 与 Claude 在部分工作中可媲美人类专家
OpenAI近日推出了一项全新的基准测试GDPval,旨在衡量其AI模型在实际经济价值创造任务中与各行业专业人士的表现对比。这一测试是OpenAI探索通用人工智能(AGI)发展路径中的关键一步,重点评估AI系统在真实职业场景中替代或辅助人类工作的潜力。 根据测试结果,OpenAI最新的GPT-5模型以及Anthropic公司推出的Claude Opus 4.1,在多项任务中已接近甚至达到行业专家水平。尽管如此,OpenAI强调,当前版本的测试仍处于初步阶段,并不能全...

Zed 编辑器 AI 辅助编程功能改为“按 Token 用量收费”

Zed 编辑器 AI 辅助编程功能改为“按 Token 用量收费”
开源代码编辑器 zed 宣布对其 ai 辅助功能的计费模式进行重大调整,将从原有的“按 prompt 提交次数”计费,转向基于“token 实际用量”的新机制。此举旨在让费用结构更贴近实际资源消耗成本,同时为用户提供更高的使用灵活性。 主要变更内容 新的 Token 计费方案即日起适用于所有新用户;现有 Pro 订阅用户享有三个月的过渡期以适应变更。 免费用户将在 2025 年 10 月中旬正式切换至新计费体系。虽然不再限制 Prompt 提交次数,但编辑预测(...

Anthropic 计划全球扩张:国际员工将翻倍,聚焦 AI 市场

Anthropic 计划全球扩张:国际员工将翻倍,聚焦 AI 市场
anthropic 近日透露,计划在2025年前将海外员工数量扩充至目前的三倍,同时将其人工智能应用团队规模扩大五倍。此举旨在加速拓展美国以外市场,提升与 openai、微软及谷歌等科技巨头的竞争实力。 数据显示,Claude 的全球使用量持续攀升,近80% 的活跃使用行为来自美国之外地区。在韩国、澳大利亚和新加坡等国家,其市场渗透率已反超美国本土。公司首席商务官保罗・史密斯指出,国际业务增长势头强劲,尤其在生命科学和财富管理领域,客户需求呈现爆发式上升。例如,丹麦...

仅 2B 激活参数,Moondream 3.0 碾压 GPT-5 和 Claude 4

仅 2B 激活参数,Moondream 3.0 碾压 GPT-5 和 Claude 4
最新推出的 Moondream3.0(预览版)凭借创新的混合专家(MoE)架构,以总计9B参数、实际激活仅2B的轻量化设计,在视觉理解与推理任务中展现出顶尖性能。这一版本在保持高效推理速度的同时,显著提升了模型能力边界,甚至在多项评测中超越GPT-5、Gemini及Claude4等闭源大模型。 相比年初发布的Moondream2(以验证码识别见长),3.0版本实现了全面升级:支持长达32K的上下文输入,适用于实时对话交互和自动化代理流程。其核心采用SigLIP作为视...