星空影视网

展开菜单

实测Opus 4.5 AI编程能力大跃进 效能更强还变便宜

实测Opus 4.5 AI编程能力大跃进 效能更强还变便宜
ai巨头anthropic近日掀起行业波澜,正式发布其最新旗舰级基础模型——claude opus 4.5。官方宣称,该模型在日常任务执行与程式编写等关键场景中,性能实现“显著跃升”。 据Anthropic发布的最新公告,Opus 4.5不仅在整体表现上超越前代产品Opus 4.1及同系列的Sonnet 4.5,更令人瞩目的是其定价策略较旧款Opus更为实惠,主打高性能与高性价比的结合。TechRadar指出,新模型在实用性与输出准确性方面均有明显进步,尤其在处理复杂数...

模力方舟 Gitee AI,差点我就骂娘了!

模力方舟 Gitee AI,差点我就骂娘了!
心血来潮,想试试用 ai ide 和 ai 应用开发平台这一整套“ai 武装”来打造一个 ai 小工具。结果刚上手,就被卡在了这个叫“模力方舟”(也就是 gitee ai)的 ai 应用开发平台上。 不过生气也就一会儿的事——因为我转头就用 AI 把问题搞定了,后面一路畅通无阻。 本来差点要开喷,结果最后不仅应用顺利上线,我还得回头夸一夸这个模力方舟平台。 简单说说过程。 我先把核心功能写好跑通了,准备接入模力方舟,主要是为了用它的上架发布、账号系统和支付能力这些...

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理
两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。 今日,我们正式发布两款全新模型: DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。 官方网页端、...

Cherry Studio v1.7.1 正式发布,Agent 功能重磅上线

Cherry Studio v1.7.1 正式发布,Agent 功能重磅上线
cherry studio v1.7.1 带着备受瞩目的 agent(智能体)功能,正式上线! ? 核心更新:Agent 功能全面登场 本次版本的最大亮点,莫过于 Agent 功能的完整集成。这不仅是一次简单的功能升级,更是 Cherry Studio 在 AI 交互方式上迈出的关键一步。现在的 Agent 能够自主解析复杂任务、制定执行计划,并通过调用各类工具(Tools)来实现目标,为你开启全新的自动化与智能化工作流体验。 ? 关于 Agent 模型支持的重要...

Anthropic 内部报告:AI 正在彻底重塑软件工程的工作方式

Anthropic 内部报告:AI 正在彻底重塑软件工程的工作方式
anthropic 近日公布了一份内部调研报告,以“自我反思”为路径,深入剖析了ai工具对其内部工程师与研究人员工作模式所产生的根本性重塑。 这份名为《AI 如何重塑 Anthropic 的工作方式》的报告,基于2025年8月面向公司内132名技术员工开展的问卷调查,以及覆盖53位成员的深度一对一访谈,勾勒出一幅高能效与高不确定性并存的职场新图景:一方面,个体产出显著跃升;另一方面,能力焦虑悄然滋长,人际协作纽带亦面临松动。 数据显示,AI已深度嵌入Anthrop...

Anthropic 宣布收购开源 JavaScript 运行时 Bun

Anthropic 宣布收购开源 JavaScript 运行时 Bun
anthropic 正式宣布完成对高性能 javascript 运行时 bun 的收购。未来,bun 将作为 claude code、claude agent sdk 以及后续 ai 编程相关产品的核心底层引擎。 此次整合将保持 Bun 的开源属性与 MIT 许可协议不变,原开发团队将继续独立运作,并维持一贯的公开透明开发模式。 本次战略收购的核心目标,是融合 Bun 在构建速度、执行效率及工具链集成方面的领先优势,与 Claude Code 强大的 AI 编程能力,...

亚马逊发布 Nova 2 系列模型

亚马逊发布 Nova 2 系列模型
亚马逊近日正式发布了全新的 nova2 模型系列,包含四款新型模型及多项配套服务。该系列产品在推理能力、多模态处理、对话式 ai、代码生成以及 agent 任务执行等方面,展现出卓越的价格性能优势,迅速成为行业焦点。 其中,Nova2Lite 是一款面向日常任务场景打造的高效、低成本推理模型,支持文本、图像和视频输入,并可生成高质量的文本输出。在与多个主流模型的对比测试中表现亮眼:在15项基准测试中,有13项成绩持平或优于 Claude Haiku4.5;在与 GP...

OpenAI 等头部 AI 企业的安全监管未达到全球标准

OpenAI 等头部 AI 企业的安全监管未达到全球标准
非营利组织生命未来研究所(future of life institute)近日发布了最新版《ai 安全指数》报告,该报告由多位人工智能领域权威专家共同编制,对当前主流ai企业于关键安全维度的表现进行了系统性评估与评级。 核心结论如下: 头部机构与其余参评方之间仍呈现显著分层态势。Anthropic、OpenAI 及谷歌 DeepMind 位列第一梯队,而 Z.ai、xAI、Meta、阿里云、DeepSeek 等则处于后续梯队。二者差距最为突出的环节集中于风险识...

Anthropic 与 Snowflake 达成 2 亿美元合作

Anthropic 与 Snowflake 达成 2 亿美元合作
anthropic 宣布与 snowflake 达成一项总额达 2 亿美元的战略合作,目标是将先进的 ai 智能体能力规模化落地至全球企业级应用场景。 “这一为期多年的 2 亿美元合作协议,不仅将推动 Anthropic 的 Claude 系列大模型深度集成至 Snowflake 平台,并面向 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Azure 等主流云生态中的逾 12,600 家全球客户开放;更将联合启动一项...

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux
openagi 基金会近期正式推出其首款面向“computer-use”场景的基座模型——lux。官方宣称该模型为“全球性能最强、响应最快、成本最低的 computer-use 模型”,并已通过配套 sdk 全面开放,支持所有开发者及企业快速集成,用于打造自动化与智能代理类应用。 Lux 设计了三种灵活的运行模式,以精准匹配不同复杂度的任务需求: Actor 模式:适用于目标清晰、步骤单一、执行路径明确的轻量任务,具备毫秒级响应能力; Thinker 模式:...