美国人工智能初创企业 reflection ai 宣布成功募集 20 亿美元资金,其中英伟达领衔投资 8 亿美元,推动公司估值跃升至 80 亿美元。这家成立仅一年的科技新星,致力于打造“人人可及的前沿开放智能(open intelligence)”。
Reflection AI 表示,已集结一支由顶尖人才组成的AI团队,搭建出具备先进水平的大模型训练平台,并将所筹资金全面投入开放型AI基础设施的发展。
该公司坚信,技术与科学的重大飞跃始终源于开放共享与协同合作。从...
10月14日凌晨,蚂蚁集团正式发布了具备万亿参数的思考型模型ring-1t,并全面开放其模型权重与训练方法的源代码。该模型在9月30日发布的预览版本ring-1t-preview基础上,进一步深化了大规模可验证奖励强化学习(rlvr)的训练过程,充分释放了万亿级基座模型在自然语言推理方面的潜力,同时通过rlhf技术优化模型的通用性能,在多项评测任务中展现出更加均衡且强劲的表现。
为持续提升复杂推理能力,尤其是数学领域的表现,百灵团队将Ring-1T接入多智能体协同推理框...
谷歌近日宣布,其NotebookLM的视频概览功能迎来关键升级,依托Gemini最新研发的图像生成技术“Nano Banana”,现已支持根据文档内容自动生成视频。
本次更新引入了包括水彩风、纸艺风、动漫风在内的六种视觉风格供用户选择。同时,新增“Brief”视频格式,与原有的“Explainer”模式相辅相成,分别适用于快速提炼核心信息和深入解读内容的场景。
在操作上,用户只需在NotebookLM中选定所需分析的文档,点击“视频概览”功能,即可自由设定视频风格...
阿里通义 qwen 团队近日正式推出了 qwen3-vl 系列的新成员 —— 4b 与 8b 参数规模的视觉语言模型。该系列于上月首次发布,是目前 qwen 系列中性能最强的多模态模型。
此次更新新增了 4B 和 8B 两种尺寸,每种均提供 Instruct 与 Thinking 两个版本,满足不同应用场景的需求。
本次发布的模型达成了三大核心目标:
更低的部署门槛:通过减小模型体积,大幅降低了显存(VRAM)占用,使得更多开发者能够在普通硬件设备上高效运行...
stateof.ai正式发布了《2025年度人工智能现状报告》(State of AI Report 2025),这是该系列的最新一版年度洞察,全面追踪全球AI技术、应用与政策的发展脉络。今年的关键亮点如下:
---------------------
? OpenAI仍领跑前沿,但领先优势缩小
OpenAI在最先进模型的研发上继续保持微弱领先,然而随着Meta逐步退出第一梯队的竞争,全球格局正变得更加开放。中国模型如DeepSeek、Qwen和Kimi在推理...
谷歌近期有消息称,veo3.1的公共发布即将到来。随着gemini应用程序中出现了相关免责声明,谷歌正准备向广大用户展示veo3.1的各项功能,这些功能或将通过用户熟悉的gemini界面呈现。
社区知名人士Logan Kilpatrick在社交媒体平台X上发布的动态被广泛解读为谷歌AI新产品即将发布的早期信号。与此同时,Vertex AI平台已出现“VEO3.0Generate”和“VEO3.0Fast Generate”等预览模型的调用记录,表明谷歌正为企业用户和...
anthropic 推出了全新模型 claude haiku 4.5。官方称,该模型在成本极低的前提下,实现了接近顶级模型的强劲性能,旨在成为实时性要求高、低延迟任务(如对话助手和客户服务)的首选方案。
Claude 系列目前包含三种不同规模的模型:Claude Opus(大杯)、Sonnet(中杯)以及 Haiku(小杯)。此次更新的最大亮点在于,小杯型号 Haiku 4.5 在维持出色性能的同时,显著提升了响应速度,并进一步降低了使用成本。
从应用角度看,An...
谷歌近日发布了其视频生成模型veo3.1,作为今年5月推出的veo3的进阶版本。此次升级在音频生成、编辑控制精度以及图像转视频的表现质量上均有显著优化,能够产出更加逼真的视频内容,并更精准地响应用户的提示指令。
在功能方面,Veo3.1支持向现有画面中添加新对象,系统会自动将其与原始场景的视觉风格相融合,实现自然衔接。谷歌还预告,其视频编辑工具Flow即将上线移除视频中已有对象的功能,进一步提升创作过程中的灵活性与可控性。
此前,Veo3已具备多种高级编辑能力,例...
百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v1.5中,paddleocr-vl以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线sota,超越 gpt-4o、gemini-2.5 pro、qwen2.5-vl-72b等主流多模态大模型,以及monkeyocr-pro-3b、mineru2.5、dots.ocr等ocr专业模型,刷新全球ocr vl模型性能天花板。...
10月19日,anthropic、英国ai安全研究所与艾伦·图灵研究所联合发布一项最新研究成果:当前主流大语言模型(包括claude、chatgpt和gemini等)对数据中毒攻击的防御能力远不如预期,攻击者仅需极少量恶意样本即可成功植入“后门”。
研究团队在参数量从600万到130亿不等的多个AI模型上进行了系统性训练实验。结果表明,无论模型体量如何,只要在训练数据中混入约250份被篡改的文件,就能有效操控模型的行为输出。这一发现挑战了过去普遍认为“模型规模越大越难被...