蚂蚁百灵大模型团队近日正式开源了高效推理模型 ring-mini-sparse-2.0-exp,该模型基于全新设计的 ling 2.0 架构,专为长序列解码任务优化,创新性地结合了高稀疏度的 mixture of expert(moe)结构与稀疏注意力机制。
据团队介绍,通过架构与推理系统的深度协同优化,该模型在处理复杂长序列推理任务时,吞吐量相较原始版本 Ring-mini-2.0 提升近 3 倍。同时,在多个高难度推理基准测试中持续保持领先水平(SOTA),为开源社...
月之暗面(moonshot ai)近日推出了自研的开源 agentic coding 工具——kimi cli 技术预览版。
据悉,Kimi CLI 以类 Shell 的界面作为原生交互形态,用户可通过 Ctrl-K 快捷键在 Agent 模式与传统 Shell 命令模式之间自由切换。此外,该工具已支持 ACP 协议,未来可兼容多种 ACP 客户端,从而为用户提供更贴近图形化开发习惯的操作体验。
如需了解 Kimi CLI 技术预览版的详细使用方法,可查阅官方文档...
项目介绍
敲敲云是一款免费的企业级零代码平台,用户无需编码,即可拖拽快速搭建出复杂业务系统,5 分钟可搭建一套 crm 系统、进销存系统等! 她集成了零代码应用、ai 应用平台和 ai 知识库,可帮助企业快速搭建个性化业务应用 和 ai 应用、ai 知识库、ai 聊天助手! 敲敲云拥有完善的应用搭建能力、表单引擎、流程引擎、仪表盘引擎,可满足企业 90% 以上的业务场景需求。
无需编码,10 分钟,让大学生傻瓜式搭建自己的毕业设计!
? 专注于开源,打造 "专业...
hugging face 正式推出了其核心库 huggingface_hub 的 v1.0 里程碑版本,标志着开源机器学习基础设施迈入新阶段。
该版本致力于为未来十年的开源 AI 生态系统奠定坚实基础,带来了一系列重大功能升级与架构调整。其中包括将底层 HTTP 客户端切换至 httpx,全面重构命令行工具(CLI),并正式启用 hf_xet 作为默认的文件传输协议。
原有的 huggingface-cli 已被全新的 hf 命令取代,采用更清晰的“资源-动作...
hami 社区在 v2.7.0 版本中正式上线了面向 nvidia gpu 的 拓扑感知调度 功能。该功能旨在应对高性能计算(hpc)与 ai 大模型训练中的多卡通信瓶颈,通过智能任务调度机制,将计算负载精准部署到物理连接最优、通信延迟最低的 gpu 组合上,显著提升任务执行效率和集群整体算力利用率。本文将在介绍功能亮点的基础上,深入源码层面,全面解析 hami 实现 nvidia gpu 拓扑感知调度的设计思路与关键技术。
一、核心功能概览
动态生成拓扑通信分值:...
蚂蚁百灵大模型团队近日正式开源了 ring-flash-linear-2.0-128k 模型,该模型特别适用于超长文本下的代码生成、编程任务以及智能 agent 等复杂应用场景。
据悉,该模型采用线性注意力与标准注意力机制相结合的混合架构,在保证高效推理的同时实现了卓越的性能表现。通过融合成熟的 MoE(Mixture of Experts)设计与多项优化技术——包括 1/32 的专家激活比率和 MTP 层结构,Ring-flash-linear 能在仅激活 6.1B...
小红书联合中国人民大学研究团队近日推出了一款名为“deepagent”的开源通用ai智能体。该智能体具备可扩展的工具调用能力,能够在端到端的推理过程中,自主搜索并使用来自超过16,000个rapidapi接口中的合适工具,以完成各类常见任务。
DeepAgent提出了一种统一、连续且高度自主的推理框架,突破了传统分阶段代理工作流的局限。其主要特性包括:
端到端深度推理:整个任务在一条连贯的思维链中完成,避免信息断裂
动态工具发现与调用:无需预先设定可...
蚂蚁百灵大模型团队近日正式推出了全新开源全模态大模型——ming-flash-omni-preview,标志着首个参数规模突破千亿的全模态模型正式向社区开放。该模型基于ling 2.0的稀疏moe架构构建,总参数量达103b,激活参数仅为9b,在保持高效推理的同时显著提升了多模态理解与生成能力。
相较于此前广受好评的Ming-lite-omni-1.5,新模型在图像、视频、语音等多个模态任务中实现了全面升级,尤其在可控图像生成、流式视频理解和高精度语音识别方面表现突出,...
复旦大学携手美团longcat共同发布了 r-horizon——首个专注于系统性评估与提升大型推理模型(lrms)长链推理能力的评测框架与训练方法。
R-HORIZON 创新性地提出了“问题组合”(Query Composition)策略,通过在不同问题之间建立逻辑依赖关系,将原本独立的任务转化为复杂的多阶段推理流程。
以数学推理任务为例,该方法包含以下三个关键步骤:
信息提取:从原始问题中抽取关键数值、变量等核心要素
依赖构建:将前一个问题的解答结果...
近日,soul app ai团队(soul ai lab)正式对外开源其最新研发的播客语音合成模型——soulx-podcast。该模型专为多人、多轮对话场景设计,支持中文、英文、四川话、粤语等多种语言与方言,并具备丰富的副语言表达能力,可稳定生成超过60分钟自然流畅、角色切换精准、韵律变化生动的长时语音内容。
除了在播客创作中表现出色,SoulX-Podcast在通用语音合成和声音克隆等应用场景下同样展现出卓越性能,带来更加真实且富有表现力的听觉体验。
Soul...