deepseek 第24页_星空影视网

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4：能效暴增50倍

8月29日消息，nvidia近期发布了其第二季度财报，业绩持续呈现爆发式增长。备受瞩目的新一代ai显卡blackwell系列中的旗舰型号gb300，预计将在今年第四季度正式上市。与此同时，下一代rubin架构已有6款产品正在规划推进中。关于GB300的详细规格可参考此前发布的资讯，而更值得关注的是其背后可能引发中美AI技术路线分化的趋势——在算法标准的选择上，国产AI生态与NVIDIA已显现分歧。国内主流选择的是UE8M0 FP8标准，而NVIDIA在Blackwel...

2026-01-09/ 3 次浏览/ 资讯

美团正式发布并开源 LongCat-Flash-Chat

美团正式推出 longcat-flash-chat，并宣布全面开源。该模型基于创新的混合专家系统（mixture-of-experts, moe）架构，总参数规模达 560b，实际激活参数范围为 18.6b~31.3b（平均约 27b），在保障高性能的同时显著提升了计算效率。评测结果显示，LongCat-Flash-Chat 作为一款非推理型基础模型，在仅激活少量参数的情况下，整体表现可与当前主流领先模型相媲美，尤其在智能体任务中展现出卓越能力。得益于专为推理效率优化...

2026-01-09/ 3 次浏览/ 资讯

行业竞逐AI暖通新赛道，海尔物联多联机份额23.5%中国首位

当ai邂逅暖通生态，会激荡出怎样的创新浪潮？在行业面临周期性压力的当下，各大厂商正全力探寻新的增长突破口。然而，ai技术的融合并非简单叠加，而是对品牌综合实力的一次全面检验。在此赛道上，海尔已率先交出一份亮眼答卷。8月28日发布的海尔智家2025年上半年财报显示，其在物联多联机市场以23.5%的份额持续领跑，连续五年稳居中国品牌榜首。这一成绩的背后，离不开两大关键战略：一是持续推动产品与场景创新，二是构建开放生态实现多方共赢。破局：搭载行业大模型的AI多联机...

2026-01-09/ 3 次浏览/ 资讯

中国企业调用大模型日均超 10 万亿 Tokens

9月1日，国际权威市场研究机构沙利文（frost & sullivan）正式发布《中国genai市场洞察：企业级大模型调用全景研究，2025》。报告显示，2025年上半年，中国企业级大模型日均总调用量达到10.2万亿tokens，其中阿里通义以17.7%的市场份额位居榜首，成为最受中国企业青睐的大模型产品。《中国GenAI市场洞察：企业级大模型调用全景研究，2025》发布本次研究覆盖了国内700家代表性企业，涵盖金融、制造、互联网、消费电子、汽车等核心行业，并...

2026-01-09/ 4 次浏览/ 资讯

权威报告：中国企业级大模型市场阿里通义份额第一

9月1日，国际权威市场研究机构沙利文（frost & sullivan）正式发布《中国genai市场洞察：企业级大模型调用全景研究，2025》报告。数据显示，2025年上半年，中国企业在大模型领域的日均总消耗量已达10.2万亿tokens。其中，阿里通义以17.7%的市场份额位居榜首，成为最受中国企业青睐的大模型平台。生成式AI正以前所未有的速度深入中国企业级应用。沙利文此次调研覆盖了国内700家来自金融、制造、互联网、消费电子、汽车等关键行业的企业，涵盖不同营收...

2026-01-09/ 3 次浏览/ 资讯

微软发布开源数学推理模型 rStar2-Agent

微软近日推出了一款名为“rstar2-agent”的开源模型，这是一个拥有140亿参数的数学推理模型，凭借更智能而非冗长的思维过程，实现了与6710亿参数的deepseek-r1模型相媲美的性能表现。该模型具备自主规划、逻辑推理以及调用代码工具的能力，能够高效地探索、验证并反思复杂问题的解决方案。其卓越能力源于三大关键技术突破：GRPO-RoC算法、可扩展且高效的强化学习（RL）基础设施，以及从非推理SFT起步的渐进式Agent训练策略。 rStar2-Agen...

2026-01-09/ 2 次浏览/ 资讯

浪潮云海亮相2025中国算力大会重磅发布InCloudAIOS平台

8月22日至24日，以“算网筑基智引未来”为主题的2025中国算力大会在山西大同隆重召开。作为云计算领域的先锋力量，浪潮云海在大会上正式推出全新ai云基础设施平台——incloudaios。该平台精准定位为“融合型ai底座”，一经发布即引发业界高度关注。 AI发展路径清晰，云成核心承载平台当前，人工智能正加速融入各行各业，发展趋势日益明确：从业务模式看，企业AI正从单一功能的“辅助工具”向驱动全局的“智能引擎”跃迁；从基础设施布局看，AI算力正逐步摆脱传统孤立...

2026-01-09/ 4 次浏览/ 资讯

DeepSeek 公开模型原理与训练方法说明

deepseek近日发布了官方说明，详细介绍了其大语言模型的训练机制与数据来源。据披露，其在线服务依托于深度神经网络大模型，整体训练过程分为“预训练—优化训练”两个阶段。在预训练阶段，模型通过大规模自监督学习，从海量文本中掌握语言的基本结构与通用知识；进入优化训练阶段后，则采用有监督微调（SFT）或强化学习（RL）等方法，使模型能够更好地适应具体任务需求。最终上线的模型以自回归方式逐字生成响应内容，而非依赖固定模板或检索已有信息。关于数据构成，预训练所使用的语...

2026-01-09/ 3 次浏览/ 资讯

腾讯开源 Hunyuan-MT-7B 翻译模型

腾讯宣布开源在国际机器翻译比赛中斩获30项冠军的翻译模型 hunyuan-mt-7b，该模型不仅支持中文、英语、日语等主流语言，还涵盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。 Hunyuan-MT-7B 模型总参数量仅为70亿，支持33种语言互译，并包含5种民族语言与汉语之间的双向翻译，是一款功能全面且轻量高效的多语言翻译模型。此次同步开源的还有翻译集成模型 Hunyuan-MT-Chimera-7B（奇美拉），这是行业内首个翻译集成模型。它能够综合原始文...

2026-01-09/ 2 次浏览/ 资讯

腾讯优图实验室正式开源智能体框架 Youtu-Agent

9月2日，腾讯优图实验室正式宣布开源其全新智能体框架——youtu-agent。该框架以极简架构与卓越性能为核心设计理念，致力于为科研人员及开发者提供一个高效、易用且结果可复现的智能体开发平台。据悉，Youtu-Agent 是一个面向真实应用场景的开源框架，具备广泛的应用覆盖能力，涵盖文件管理、数据解析、学术研究以及广域信息综述等多个领域。目前，该框架已成功应用于腾讯云多个产品线，支撑实际业务运行。其关键优势在于：无需额外训练模型，也不依赖国外闭源大模型API，即...

2026-01-09/ 3 次浏览/ 资讯

‹‹ ‹ 20 21 22 23 24 25 26 27 28 29 › ››