gemini 第11页_星空影视网

Reflection AI 完成 20 亿美元融资，打造“开放智能”

美国人工智能初创企业 reflection ai 宣布成功募集 20 亿美元资金，其中英伟达领衔投资 8 亿美元，推动公司估值跃升至 80 亿美元。这家成立仅一年的科技新星，致力于打造“人人可及的前沿开放智能（open intelligence）”。 Reflection AI 表示，已集结一支由顶尖人才组成的AI团队，搭建出具备先进水平的大模型训练平台，并将所筹资金全面投入开放型AI基础设施的发展。该公司坚信，技术与科学的重大飞跃始终源于开放共享与协同合作。从...

2026-01-09/ 60 次浏览/ 资讯

蚂蚁发布并开源万亿参数思考模型Ring-1T，综合能力逼近GPT-5

10月14日凌晨，蚂蚁集团正式发布了具备万亿参数的思考型模型ring-1t，并全面开放其模型权重与训练方法的源代码。该模型在9月30日发布的预览版本ring-1t-preview基础上，进一步深化了大规模可验证奖励强化学习（rlvr）的训练过程，充分释放了万亿级基座模型在自然语言推理方面的潜力，同时通过rlhf技术优化模型的通用性能，在多项评测任务中展现出更加均衡且强劲的表现。为持续提升复杂推理能力，尤其是数学领域的表现，百灵团队将Ring-1T接入多智能体协同推理框...

2026-01-09/ 60 次浏览/ 资讯

谷歌 NotebookLM 视频概览功能升级：引入“Nano Banana”

谷歌近日宣布，其NotebookLM的视频概览功能迎来关键升级，依托Gemini最新研发的图像生成技术“Nano Banana”，现已支持根据文档内容自动生成视频。本次更新引入了包括水彩风、纸艺风、动漫风在内的六种视觉风格供用户选择。同时，新增“Brief”视频格式，与原有的“Explainer”模式相辅相成，分别适用于快速提炼核心信息和深入解读内容的场景。在操作上，用户只需在NotebookLM中选定所需分析的文档，点击“视频概览”功能，即可自由设定视频风格...

2026-01-09/ 3 次浏览/ 资讯

通义千问 Qwen3-VL 上新：4B & 8B 稠密模型

阿里通义 qwen 团队近日正式推出了 qwen3-vl 系列的新成员 —— 4b 与 8b 参数规模的视觉语言模型。该系列于上月首次发布，是目前 qwen 系列中性能最强的多模态模型。此次更新新增了 4B 和 8B 两种尺寸，每种均提供 Instruct 与 Thinking 两个版本，满足不同应用场景的需求。本次发布的模型达成了三大核心目标：更低的部署门槛：通过减小模型体积，大幅降低了显存（VRAM）占用，使得更多开发者能够在普通硬件设备上高效运行...

2026-01-09/ 3 次浏览/ 资讯

stateof.ai 发布 2025 人工智能现状报告

stateof.ai正式发布了《2025年度人工智能现状报告》（State of AI Report 2025），这是该系列的最新一版年度洞察，全面追踪全球AI技术、应用与政策的发展脉络。今年的关键亮点如下： --------------------- ? OpenAI仍领跑前沿，但领先优势缩小 OpenAI在最先进模型的研发上继续保持微弱领先，然而随着Meta逐步退出第一梯队的竞争，全球格局正变得更加开放。中国模型如DeepSeek、Qwen和Kimi在推理...

2026-01-09/ 3 次浏览/ 资讯

消息称谷歌即将在 Gemini 和 API 上发布 VEO 3.1 版本

谷歌近期有消息称，veo3.1的公共发布即将到来。随着gemini应用程序中出现了相关免责声明，谷歌正准备向广大用户展示veo3.1的各项功能，这些功能或将通过用户熟悉的gemini界面呈现。社区知名人士Logan Kilpatrick在社交媒体平台X上发布的动态被广泛解读为谷歌AI新产品即将发布的早期信号。与此同时，Vertex AI平台已出现“VEO3.0Generate”和“VEO3.0Fast Generate”等预览模型的调用记录，表明谷歌正为企业用户和...

2026-01-09/ 2 次浏览/ 资讯

Anthropic 发布 Claude Haiku 4.5，速度更快、价格更便宜

anthropic 推出了全新模型 claude haiku 4.5。官方称，该模型在成本极低的前提下，实现了接近顶级模型的强劲性能，旨在成为实时性要求高、低延迟任务（如对话助手和客户服务）的首选方案。 Claude 系列目前包含三种不同规模的模型：Claude Opus（大杯）、Sonnet（中杯）以及 Haiku（小杯）。此次更新的最大亮点在于，小杯型号 Haiku 4.5 在维持出色性能的同时，显著提升了响应速度，并进一步降低了使用成本。从应用角度看，An...

2026-01-09/ 3 次浏览/ 资讯

谷歌 Veo 3.1 正式发布：新增音频功能和精细化编辑能力

谷歌近日发布了其视频生成模型veo3.1，作为今年5月推出的veo3的进阶版本。此次升级在音频生成、编辑控制精度以及图像转视频的表现质量上均有显著优化，能够产出更加逼真的视频内容，并更精准地响应用户的提示指令。在功能方面，Veo3.1支持向现有画面中添加新对象，系统会自动将其与原始场景的视觉风格相融合，实现自然衔接。谷歌还预告，其视频编辑工具Flow即将上线移除视频中已有对象的功能，进一步提升创作过程中的灵活性与可控性。此前，Veo3已具备多种高级编辑能力，例...

2026-01-09/ 3 次浏览/ 资讯

百度正式发布多模态文档解析模型方案 PaddleOCR-VL

百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v1.5中，paddleocr-vl以92.6分取得综合性能全球第一成绩，四大核心能力（文本、表格、公式、阅读顺序）全线sota，超越 gpt-4o、gemini-2.5 pro、qwen2.5-vl-72b等主流多模态大模型，以及monkeyocr-pro-3b、mineru2.5、dots.ocr等ocr专业模型，刷新全球ocr vl模型性能天花板。...

2026-01-09/ 3 次浏览/ 资讯

AI模型也能被“洗脑”！仅需250份文件就能控制ChatGPT回应

10月19日，anthropic、英国ai安全研究所与艾伦·图灵研究所联合发布一项最新研究成果：当前主流大语言模型（包括claude、chatgpt和gemini等）对数据中毒攻击的防御能力远不如预期，攻击者仅需极少量恶意样本即可成功植入“后门”。研究团队在参数量从600万到130亿不等的多个AI模型上进行了系统性训练实验。结果表明，无论模型体量如何，只要在训练数据中混入约250份被篡改的文件，就能有效操控模型的行为输出。这一发现挑战了过去普遍认为“模型规模越大越难被...

2026-01-09/ 3 次浏览/ 资讯

‹‹ ‹ 7 8 9 10 11 12 13 14 15 16 › ››