8月29日消息,nvidia近期发布了其第二季度财报,业绩持续呈现爆发式增长。备受瞩目的新一代ai显卡blackwell系列中的旗舰型号gb300,预计将在今年第四季度正式上市。与此同时,下一代rubin架构已有6款产品正在规划推进中。
关于GB300的详细规格可参考此前发布的资讯,而更值得关注的是其背后可能引发中美AI技术路线分化的趋势——在算法标准的选择上,国产AI生态与NVIDIA已显现分歧。国内主流选择的是UE8M0 FP8标准,而NVIDIA在Blackwel...
美团正式推出 longcat-flash-chat,并宣布全面开源。该模型基于创新的混合专家系统(mixture-of-experts, moe)架构,总参数规模达 560b,实际激活参数范围为 18.6b~31.3b(平均约 27b),在保障高性能的同时显著提升了计算效率。
评测结果显示,LongCat-Flash-Chat 作为一款非推理型基础模型,在仅激活少量参数的情况下,整体表现可与当前主流领先模型相媲美,尤其在智能体任务中展现出卓越能力。得益于专为推理效率优化...
当ai邂逅暖通生态,会激荡出怎样的创新浪潮?在行业面临周期性压力的当下,各大厂商正全力探寻新的增长突破口。然而,ai技术的融合并非简单叠加,而是对品牌综合实力的一次全面检验。
在此赛道上,海尔已率先交出一份亮眼答卷。8月28日发布的海尔智家2025年上半年财报显示,其在物联多联机市场以23.5%的份额持续领跑,连续五年稳居中国品牌榜首。这一成绩的背后,离不开两大关键战略:一是持续推动产品与场景创新,二是构建开放生态实现多方共赢。
破局:搭载行业大模型的AI多联机...
9月1日,国际权威市场研究机构沙利文(frost & sullivan)正式发布《中国genai市场洞察:企业级大模型调用全景研究,2025》。报告显示,2025年上半年,中国企业级大模型日均总调用量达到10.2万亿tokens,其中阿里通义以17.7%的市场份额位居榜首,成为最受中国企业青睐的大模型产品。
《中国GenAI市场洞察:企业级大模型调用全景研究,2025》发布
本次研究覆盖了国内700家代表性企业,涵盖金融、制造、互联网、消费电子、汽车等核心行业,并...
9月1日,国际权威市场研究机构沙利文(frost & sullivan)正式发布《中国genai市场洞察:企业级大模型调用全景研究,2025》报告。数据显示,2025年上半年,中国企业在大模型领域的日均总消耗量已达10.2万亿tokens。其中,阿里通义以17.7%的市场份额位居榜首,成为最受中国企业青睐的大模型平台。
生成式AI正以前所未有的速度深入中国企业级应用。沙利文此次调研覆盖了国内700家来自金融、制造、互联网、消费电子、汽车等关键行业的企业,涵盖不同营收...
微软近日推出了一款名为“rstar2-agent”的开源模型,这是一个拥有140亿参数的数学推理模型,凭借更智能而非冗长的思维过程,实现了与6710亿参数的deepseek-r1模型相媲美的性能表现。
该模型具备自主规划、逻辑推理以及调用代码工具的能力,能够高效地探索、验证并反思复杂问题的解决方案。其卓越能力源于三大关键技术突破:GRPO-RoC算法、可扩展且高效的强化学习(RL)基础设施,以及从非推理SFT起步的渐进式Agent训练策略。
rStar2-Agen...
8月22日至24日,以“算网筑基 智引未来”为主题的2025中国算力大会在山西大同隆重召开。作为云计算领域的先锋力量,浪潮云海在大会上正式推出全新ai云基础设施平台——incloudaios。该平台精准定位为“融合型ai底座”,一经发布即引发业界高度关注。
AI发展路径清晰,云成核心承载平台
当前,人工智能正加速融入各行各业,发展趋势日益明确:从业务模式看,企业AI正从单一功能的“辅助工具”向驱动全局的“智能引擎”跃迁;从基础设施布局看,AI算力正逐步摆脱传统孤立...
deepseek近日发布了官方说明,详细介绍了其大语言模型的训练机制与数据来源。据披露,其在线服务依托于深度神经网络大模型,整体训练过程分为“预训练—优化训练”两个阶段。
在预训练阶段,模型通过大规模自监督学习,从海量文本中掌握语言的基本结构与通用知识;进入优化训练阶段后,则采用有监督微调(SFT)或强化学习(RL)等方法,使模型能够更好地适应具体任务需求。最终上线的模型以自回归方式逐字生成响应内容,而非依赖固定模板或检索已有信息。
关于数据构成,预训练所使用的语...
腾讯宣布开源在国际机器翻译比赛中斩获30项冠军的翻译模型 hunyuan-mt-7b,该模型不仅支持中文、英语、日语等主流语言,还涵盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。
Hunyuan-MT-7B 模型总参数量仅为70亿,支持33种语言互译,并包含5种民族语言与汉语之间的双向翻译,是一款功能全面且轻量高效的多语言翻译模型。
此次同步开源的还有翻译集成模型 Hunyuan-MT-Chimera-7B(奇美拉),这是行业内首个翻译集成模型。它能够综合原始文...
9月2日,腾讯优图实验室正式宣布开源其全新智能体框架——youtu-agent。该框架以极简架构与卓越性能为核心设计理念,致力于为科研人员及开发者提供一个高效、易用且结果可复现的智能体开发平台。
据悉,Youtu-Agent 是一个面向真实应用场景的开源框架,具备广泛的应用覆盖能力,涵盖文件管理、数据解析、学术研究以及广域信息综述等多个领域。目前,该框架已成功应用于腾讯云多个产品线,支撑实际业务运行。
其关键优势在于:无需额外训练模型,也不依赖国外闭源大模型API,即...