星空影视网

展开菜单

主流 AI 聊天机器人传播虚假信息概率翻倍,高达 35%

主流 AI 聊天机器人传播虚假信息概率翻倍,高达 35%
Newsguard 最新研究显示,截至2025年8月,十大主流生成式AI工具在应对实时新闻话题时,有35%的情况会重复传播虚假信息,相较2024年8月的18%几乎翻倍。 这一显著增长与AI聊天机器人普遍集成实时网络搜索功能密切相关。该功能使AI不再回避用户提问——拒绝回应率从2024年8月的31%降至如今的0%,但同时也让其接入了充斥虚假内容的“污染型”网络信息生态。不良行为者正利用AI自动生成并扩散虚假新闻,加剧了信息失真风险。 研究发现,去年Newsguard...

Anthropic 发布 LLM Agent 工具编写指南

Anthropic 发布 LLM Agent 工具编写指南
anthropic官方博客近期推出一篇深度指南《writing effective tools for llm agents—using llm agents》,系统讲解了如何基于model context protocol(mcp)为llm agent构建高效工具。文中提出“原型-评估-协作”三阶段迭代方法,并总结出五大核心设计准则: 精心筛选工具功能 建立清晰的命名空间结构 使工具返回更富语义的上下文信息 提高输出内容的Token使用效率 借助提示...

瑞士三强联合发布开源大模型 Apertus

瑞士三强联合发布开源大模型 Apertus
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)与瑞士国家超级计算中心(CSCS)携手推出了一款名为“Apertus”的大型开源语言模型。该名称源自拉丁语,意为“开放”,也正体现了该项目的核心理念。 与当前主流的美国大模型如OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude不同,Apertus不仅仅在性能上追求突破,更因其极高的透明度而引发广泛关注。该模型的所有组成部分——包括模型权重、架构设计、...

Anthropic 的 Claude AI 正式上线 Xcode 26

Anthropic 的 Claude AI 正式上线 Xcode 26
Anthropic 宣布其 AI 助手 Claude 正式登陆 Xcode,Apple 专属的集成开发环境(IDE),为开发、测试和发布 Apple 平台应用程序提供全套工具支持。 此次集成让开发者能够在日常开发流程中直接调用 Claude 强大的代码能力,显著提升在 iOS、macOS 等 Apple 生态系统中构建应用的效率。 登录 Xcode 中的 Claude 账户后,用户即可体验由 Claude Sonnet 4 驱动的智能编程功能,包括: 代码助...

CodeRabbit 发布面向终端的 AI 代码审查 CLI 工具

CodeRabbit 发布面向终端的 AI 代码审查 CLI 工具
ai代码审查初创公司coderabbit近日发布了“coderabbit cli”——一款专为终端环境设计的智能代码审查工具,可与claude code、codex cli、cursor cli、gemini等主流ai编程助手实现无缝对接。 据CodeRabbit介绍,随着越来越多开发者依赖CLI端的AI编码工具进行开发,一个显著问题浮现:代码生成效率大幅提升,但质量保障却常常延迟到Pull Request阶段才被处理。 CodeRabbit CLI将AI驱动的代...

微软 Visual Studio Code 引入自动 AI 模型选择功能

微软 Visual Studio Code 引入自动 AI 模型选择功能
微软正为Visual Studio Code编辑器新增一项自动AI模型选择功能,系统将依据“最优性能”自动匹配合适的AI模型。 该功能将针对GitHub Copilot的免费用户,在Claude Sonnet 4、GPT-5、GPT-5 mini等多个模型之间动态切换;而付费用户则会“以Claude Sonnet 4为主”进行服务支持。 这一调整实际上反映出,微软在编程辅助领域更青睐Anthropic的AI技术,而非OpenAI最新推出的GPT-5。知情人士透露,...

智谱更新 GLM Coding Plan 订阅套餐

智谱更新 GLM Coding Plan 订阅套餐
智谱AI近日升级了其GLM Coding Plan订阅服务,用户现可于更多主流AI编程平台中接入其旗舰模型GLM-4.5,享受更高效智能的编码支持。 本次更新亮点包括: 新增对多个主流开发工具的支持:涵盖Cline、Roo Code、Kilo Code、OpenCode、Crush等 Max套餐重磅升级:价格仅为Pro的2倍,使用额度却提升至4倍 Pro与Max用户将可启用Vision & Web Search功能(通过MCP实现,内置方案即将上线) 推出季度及...

声网 AI 模型评测平台新增多项评测维度 模型选择数量提升3倍

声网 AI 模型评测平台新增多项评测维度 模型选择数量提升3倍
声网 ai 模型评测平台(对话式)2.0 版本近日正式发布,评测能力迎来全面升级:测试覆盖区域扩展至10个全球核心城市,遍及各大洲;可选模型数量增长3倍;asr 模型新增支持9种语言的词错误率评估;tts 模型则在中英文场景下引入词错误率与字母数字性能对比功能,同时开放用户自定义输入中英文文本,一键生成语音效果。 自上线以来,AI 模型评测平台(对话式)凭借对 ASR+LLM+TTS 主流服务商延迟数据的横向测评能力,广受开发者欢迎。此次2.0版本新增多项衡量对话式AI...

Notion 3.0 AI 代理爆出严重漏洞,恶意 PDF 可诱导其泄露敏感数据

Notion 3.0 AI 代理爆出严重漏洞,恶意 PDF 可诱导其泄露敏感数据
随着 Notion 3.0 的推出,其引入的自主 AI 代理功能引发了广泛关注。这一新特性旨在协助用户自动化完成诸如撰写文档、维护数据库以及优化工作流等任务。 然而,网络安全企业 CodeIntegrity 最近发布的一份研究报告指出,这些 AI 代理存在一个严重安全隐患:攻击者可利用恶意文件(例如 PDF)诱使 AI 代理绕过安全机制,进而窃取系统中的敏感信息。 该漏洞的根源被研究人员称为“致命三重奏”——即大型语言模型(LLM)、对各类工具的访问权限,以及长期...

Perplexity AI 将 Comet 浏览器扩展至印度 Pro 用户

Perplexity AI 将 Comet 浏览器扩展至印度 Pro 用户
近日,人工智能搜索企业 perplexity 宣布其革命性浏览器 comet 正式向印度地区的所有 perplexity pro 用户开放,成为继美国之后第二个全面接入该服务的国家。此次上线即日生效,致力于为用户提供由 ai 驱动的智能浏览体验,助力自动化操作并提升在高速发展的数字环境中的工作效率。 Comet 浏览器于2025年7月首次发布,是一款基于 Chromium 架构的“AI 代理”型浏览器,深度融合了 Perplexity 自研的 Sonar LLM,并整合...