国际知名评测机构artificial analysis近日宣布,字节跳动最新推出的图像生成模型seedream 4.0已强势登顶文生图与图像编辑两大榜单,在综合表现上超越谷歌gemini 2.5 flash(nano-banana),成为当前全球领先的多模态图像创作模型。
https://www.php.cn/link/2ea0bbb774fbaa7f7fb4365c3ea822bf
作为豆包系列的最新一代图像模型,Seedream 4.0深度融合了文生图、图...
Adobe首席设计推广大使Howard Pinsky近日在X平台透露,谷歌广受关注的AI模型Nano Banana将于本月内正式接入Photoshop。届时,用户将能通过自然语言输入提示词,并结合Photoshop原有的选区、图层、蒙版等“非破坏性”编辑功能,实现更加精准与智能的图像处理。
该模型正式名称为谷歌Gemini 2.5 Flash Image,本月初登陆Gemini平台后迅速引发热潮。据谷歌实验室副总裁Josh Woodward介绍,该模型已累计完成超过...
2025年,“智能体元年”的说法频频被提及——大模型技术突飞猛进,各类智能体应用层出不穷,一场由ai智能体驱动的产业变革是否已悄然开启?
9月11日,在2025 Inclusion·外滩大会“智能体时代进化论”见解论坛上,来自学术界与产业界的多位专家围绕这一话题展开了深入探讨。本次论坛由硅谷101、特工宇宙与蚂蚁集团联合主办,硅星人担任特邀主持,议题涵盖智能体的技术突破、多智能体协同、开源生态构建以及垂直场景落地,直面当前行业高涨期待背后的现实挑战。
技术进展亮眼,多...
9 月 13 日,在 2025 inclusion·外滩大会的ai开源见解论坛上,蚂蚁开源携手inclusion ai正式推出了《全球大模型开源开发生态全景与趋势报告》2.0版本。
相较今年5月发布的初版,此次更新全面反映了过去百余天内开源社区的最新动态,系统梳理了人工智能开源生态的发展现状与未来走向,为技术从业者和产业界提供了权威参考。
(蚂蚁开源技术委员会副主席王旭现场解读全球大模型开源生态发展态势)
蚂蚁开源技术委员会副主席王旭表示:“我们以数据为基础,真...
Newsguard 最新研究显示,截至2025年8月,十大主流生成式AI工具在应对实时新闻话题时,有35%的情况会重复传播虚假信息,相较2024年8月的18%几乎翻倍。
这一显著增长与AI聊天机器人普遍集成实时网络搜索功能密切相关。该功能使AI不再回避用户提问——拒绝回应率从2024年8月的31%降至如今的0%,但同时也让其接入了充斥虚假内容的“污染型”网络信息生态。不良行为者正利用AI自动生成并扩散虚假新闻,加剧了信息失真风险。
研究发现,去年Newsguard...
https://www.php.cn/link/f68c0c30731d9296528efb588279e83d
蚂蚁集团携手 Inclusion AI 近日联合发布了大模型开发生态中的开源项目全景图及其配套的生态趋势洞察报告。这是继今年5月首次发布后的升级版2.0,不仅系统梳理了当前人工智能开源生态的发展格局,还整合了过去百余天内社区涌现的新动态,为行业提供更具时效性的参考依据。
该系列报告最初源自蚂蚁集团内部对技术演进的深度观察,所有数据均来自全球开源社区,基...
谷歌近日对其外包合作方 GlobalLogic 的承包商实施了裁员,导致逾200名员工失去工作。这些员工因薪资待遇不佳和工作环境恶劣长期积怨,此次裁员进一步激化矛盾,引发强烈不满与抗议。
被裁员工主要参与谷歌 AI 产品的测试与优化,涵盖最新发布的 Gemini 对话系统及其 AI 概览功能。他们的日常工作涉及审核、修正 AI 生成的内容,以提升模型输出的准确性与用户体验。然而,许多人在毫无预警的情况下接到解雇通知,公司未提供清晰解释,令他们感到震惊与无助。
安德...
ai代码审查初创公司coderabbit近日发布了“coderabbit cli”——一款专为终端环境设计的智能代码审查工具,可与claude code、codex cli、cursor cli、gemini等主流ai编程助手实现无缝对接。
据CodeRabbit介绍,随着越来越多开发者依赖CLI端的AI编码工具进行开发,一个显著问题浮现:代码生成效率大幅提升,但质量保障却常常延迟到Pull Request阶段才被处理。
CodeRabbit CLI将AI驱动的代...
小米正式宣布开源其首个原生端到端语音模型——xiaomi-mimo-audio。该模型基于创新的预训练架构,并利用超过一亿小时的海量语音数据进行训练,首次在语音领域实现了基于上下文学习(icl)的少样本泛化能力,且在预训练过程中观察到了显著的“涌现”现象。
官方指出,经过后训练优化,Xiaomi-MiMo-Audio 在智能理解、情感表达、语音表现力以及安全性等方面展现出卓越的跨模态对齐能力,使得语音交互在自然度、情绪传递和对话连贯性上达到了高度拟人化的水平。
Xia...
在 2025 年国际大学生程序设计竞赛(icpc)世界总决赛的平行 ai 测试中,openai 与谷歌 gemini 的推理模型双双摘得金牌,其中 openai 更是以满分成绩强势领跑,成为全场唯一完成所有题目的团队。
本次比赛持续五小时,共包含 12 道高难度算法题目。Gemini 成功解答了其中 10 道,并在开赛后的 30 分钟内破解了连所有人类队伍都未能攻克的“死亡之题”C 题。而 OpenAI 则以 12 题全对的完美表现,超越全部 139 支参赛的人类战...