中国信通院于日前正式发布新版本“方升”基准测试体系3.0。
“方升”大模型基准测试体系3.0在原有基础上实现系统性跃升,新增模型基础属性测试,对参数规模、推理效率等底层特征进行体系化测试;同时前瞻性布局未来高级智能测试,围绕全模态理解、长期记忆、自主学习等10项高级能力构建评估能力,并进一步深化工业制造、基础科学、金融等重点行业的场景化评测。
为支撑“方升”3.0的实施,中国信通院将从以下几方面系统强化评测基础设施:
一是扩容高质测试数据资源,围绕复杂推理、多模态...
tiobe 公布了 2025 年 10 月的编程语言排行榜。
自从 Python 在 2023 年底开始主导 TIOBE 指数以来,其后的 C、C++ 和 Java 就一直处于激烈的榜二争夺战中。
一年多来,这三门语言在榜单上的差距始终未超过1%。期间 C 曾短暂领先,C++ 随后反超,而本月 C 凭借 C23 新版本的推广再度回归第二,Java 则紧随其后位列第四。尽管 C++ 本月下跌明显,但其正在积极筹备 C++27 的核心特性开发,而 Java 最近也刚发...
2025年10月13日,百度通过其官方公众号正式宣布,百度世界2025将于11月13日在北京·国家会议中心二期举行。大会官网(https://www.php.cn/link/8072e512102b794c08f3479a856c0796。
本次大会以“效果涌现|AIinAction”为核心主题,设置1场主论坛和6场专题分论坛。百度创始人李彦宏将亲临现场发表主旨演讲,有望发布多项关键技术和战略举措。分论坛议题涵盖智能体、数字人、AI计算、智能硬件等当前AI领域的热点...
百度国际旗下智能广告平台mediago近日正式宣布,已成功加入英国数字广告领域权威组织iabuk(英国互动广告局),成为其认证会员。此前,mediago已通过审核,获准作为iabeurope透明度与同意框架(transparency and consent framework, tcf)的官方技术供应商,充分展现了其在欧洲市场持续践行数据合规与运营透明的决心。此次成为iabuk成员,标志着mediago在英国市场的合规体系建设迈出关键一步,进一步深化其在本地行业治理与生态共建...
百度搜索近日正式推出其AI短剧生成平台,并开启全面公测。该平台依托亿元级创作基金与百亿流量扶持,致力于增强内容创作者的生产力,推动IP的长期价值转化与可持续变现。
平台支持全自动创作与人机协同等多种模式,可协助创作者完成逾80%的创作流程。通过AI生成初稿后,创作者仅需进行细节调整与优化,即可高效输出高品质短剧内容。同时,系统能够延续统一的风格设定,实现规模化内容生产,显著提升效率并减少制作投入。
为应对创作中的版权难题,百度搜索将携手多家权威版权机构,向创作者开...
10月16日,字节跳动旗下的火山引擎公布了其最新大模型token(即大模型处理的文本单位)调用情况。火山引擎总裁谭待在活动现场透露,豆包大模型的使用量从2024年5月的1200亿tokens,飙升253倍至2024年9月突破30万亿tokens。
此外,根据市场研究机构IDC于9月发布的报告,2025年上半年中国公有云大模型的总调用量达到536.7万亿tokens。
在市场份额方面,火山引擎以49.2%的占比领跑中国市场,位居首位;阿里云和百度智能云分别以27...
百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v1.5中,paddleocr-vl以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线sota,超越 gpt-4o、gemini-2.5 pro、qwen2.5-vl-72b等主流多模态大模型,以及monkeyocr-pro-3b、mineru2.5、dots.ocr等ocr专业模型,刷新全球ocr vl模型性能天花板。...
10月17日消息,huggingface官网显示,百度昨晚发布的自研多模态文档解析模型paddleocr-vl,发布20小时内即登顶huggingface trending全球第一。
据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录...
10月18日,苹果公司ceo库克现身上海苏河湾大会,在接受采访时表示,apple intelligence正在积极推进进入中国市场。他强调,人工智能不仅将深刻改变人们的生活方式,甚至具备挽救生命的能力。
库克还谈到公众对AI的担忧,认为大家“无需过于紧张”。在他看来,AI带来的更多是积极影响。他坦言,自己并不担心“电脑变得像人一样思考”,反而更忧虑“人类变得像电脑一样思考”。他呼吁人们保持创造力与情感温度,避免变得冷漠、机械化。
据了解,库克此次中国之行的重点之一...
10月21日,中文精确指令遵循测评基准superclue-cpif正式上线,文心x1.1以75.51分位列国产大模型榜首,在任务类型与指令数量两大维度的评估中均居国内首位,展现出其在真实生产场景中的突出应用潜力。
此次测评共纳入包括GPT-5(high)、DeepSeek-V3.2-Exp-Thinking、Claude-Sonnet-4.5-Reasoning、Gemini-2.5-Pro在内的10款国内外主流大模型。SuperCLUE-CPIF聚焦于大型语言模型(L...