Newsguard 最新研究显示,截至2025年8月,十大主流生成式AI工具在应对实时新闻话题时,有35%的情况会重复传播虚假信息,相较2024年8月的18%几乎翻倍。
这一显著增长与AI聊天机器人普遍集成实时网络搜索功能密切相关。该功能使AI不再回避用户提问——拒绝回应率从2024年8月的31%降至如今的0%,但同时也让其接入了充斥虚假内容的“污染型”网络信息生态。不良行为者正利用AI自动生成并扩散虚假新闻,加剧了信息失真风险。
研究发现,去年Newsguard...
anthropic官方博客近期推出一篇深度指南《writing effective tools for llm agents—using llm agents》,系统讲解了如何基于model context protocol(mcp)为llm agent构建高效工具。文中提出“原型-评估-协作”三阶段迭代方法,并总结出五大核心设计准则:
精心筛选工具功能
建立清晰的命名空间结构
使工具返回更富语义的上下文信息
提高输出内容的Token使用效率
借助提示...
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)与瑞士国家超级计算中心(CSCS)携手推出了一款名为“Apertus”的大型开源语言模型。该名称源自拉丁语,意为“开放”,也正体现了该项目的核心理念。
与当前主流的美国大模型如OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude不同,Apertus不仅仅在性能上追求突破,更因其极高的透明度而引发广泛关注。该模型的所有组成部分——包括模型权重、架构设计、...
Anthropic 宣布其 AI 助手 Claude 正式登陆 Xcode,Apple 专属的集成开发环境(IDE),为开发、测试和发布 Apple 平台应用程序提供全套工具支持。
此次集成让开发者能够在日常开发流程中直接调用 Claude 强大的代码能力,显著提升在 iOS、macOS 等 Apple 生态系统中构建应用的效率。
登录 Xcode 中的 Claude 账户后,用户即可体验由 Claude Sonnet 4 驱动的智能编程功能,包括:
代码助...
ai代码审查初创公司coderabbit近日发布了“coderabbit cli”——一款专为终端环境设计的智能代码审查工具,可与claude code、codex cli、cursor cli、gemini等主流ai编程助手实现无缝对接。
据CodeRabbit介绍,随着越来越多开发者依赖CLI端的AI编码工具进行开发,一个显著问题浮现:代码生成效率大幅提升,但质量保障却常常延迟到Pull Request阶段才被处理。
CodeRabbit CLI将AI驱动的代...
微软正为Visual Studio Code编辑器新增一项自动AI模型选择功能,系统将依据“最优性能”自动匹配合适的AI模型。
该功能将针对GitHub Copilot的免费用户,在Claude Sonnet 4、GPT-5、GPT-5 mini等多个模型之间动态切换;而付费用户则会“以Claude Sonnet 4为主”进行服务支持。
这一调整实际上反映出,微软在编程辅助领域更青睐Anthropic的AI技术,而非OpenAI最新推出的GPT-5。知情人士透露,...
智谱AI近日升级了其GLM Coding Plan订阅服务,用户现可于更多主流AI编程平台中接入其旗舰模型GLM-4.5,享受更高效智能的编码支持。
本次更新亮点包括:
新增对多个主流开发工具的支持:涵盖Cline、Roo Code、Kilo Code、OpenCode、Crush等
Max套餐重磅升级:价格仅为Pro的2倍,使用额度却提升至4倍
Pro与Max用户将可启用Vision & Web Search功能(通过MCP实现,内置方案即将上线)
推出季度及...
声网 ai 模型评测平台(对话式)2.0 版本近日正式发布,评测能力迎来全面升级:测试覆盖区域扩展至10个全球核心城市,遍及各大洲;可选模型数量增长3倍;asr 模型新增支持9种语言的词错误率评估;tts 模型则在中英文场景下引入词错误率与字母数字性能对比功能,同时开放用户自定义输入中英文文本,一键生成语音效果。
自上线以来,AI 模型评测平台(对话式)凭借对 ASR+LLM+TTS 主流服务商延迟数据的横向测评能力,广受开发者欢迎。此次2.0版本新增多项衡量对话式AI...
随着 Notion 3.0 的推出,其引入的自主 AI 代理功能引发了广泛关注。这一新特性旨在协助用户自动化完成诸如撰写文档、维护数据库以及优化工作流等任务。
然而,网络安全企业 CodeIntegrity 最近发布的一份研究报告指出,这些 AI 代理存在一个严重安全隐患:攻击者可利用恶意文件(例如 PDF)诱使 AI 代理绕过安全机制,进而窃取系统中的敏感信息。
该漏洞的根源被研究人员称为“致命三重奏”——即大型语言模型(LLM)、对各类工具的访问权限,以及长期...
近日,人工智能搜索企业 perplexity 宣布其革命性浏览器 comet 正式向印度地区的所有 perplexity pro 用户开放,成为继美国之后第二个全面接入该服务的国家。此次上线即日生效,致力于为用户提供由 ai 驱动的智能浏览体验,助力自动化操作并提升在高速发展的数字环境中的工作效率。
Comet 浏览器于2025年7月首次发布,是一款基于 Chromium 架构的“AI 代理”型浏览器,深度融合了 Perplexity 自研的 Sonar LLM,并整合...