github 第18页_星空影视网

蚂蚁百灵团队开源高效推理模型 Ring-mini-sparse-2.0-exp

蚂蚁百灵大模型团队近日正式开源了高效推理模型 ring-mini-sparse-2.0-exp，该模型基于全新设计的 ling 2.0 架构，专为长序列解码任务优化，创新性地结合了高稀疏度的 mixture of expert（moe）结构与稀疏注意力机制。据团队介绍，通过架构与推理系统的深度协同优化，该模型在处理复杂长序列推理任务时，吞吐量相较原始版本 Ring-mini-2.0 提升近 3 倍。同时，在多个高难度推理基准测试中持续保持领先水平（SOTA），为开源社...

2026-01-09/ 60 次浏览/ 资讯

月之暗面推出开源 Agentic Coding 工具 Kimi CLI

月之暗面（moonshot ai）近日推出了自研的开源 agentic coding 工具——kimi cli 技术预览版。据悉，Kimi CLI 以类 Shell 的界面作为原生交互形态，用户可通过 Ctrl-K 快捷键在 Agent 模式与传统 Shell 命令模式之间自由切换。此外，该工具已支持 ACP 协议，未来可兼容多种 ACP 客户端，从而为用户提供更贴近图形化开发习惯的操作体验。如需了解 Kimi CLI 技术预览版的详细使用方法，可查阅官方文档...

2026-01-09/ 54 次浏览/ 资讯

免费开源的零代码平台 / 无代码平台，敲敲云 v2.2.0 版本发布

项目介绍敲敲云是一款免费的企业级零代码平台，用户无需编码，即可拖拽快速搭建出复杂业务系统，5 分钟可搭建一套 crm 系统、进销存系统等！她集成了零代码应用、ai 应用平台和 ai 知识库，可帮助企业快速搭建个性化业务应用和 ai 应用、ai 知识库、ai 聊天助手！敲敲云拥有完善的应用搭建能力、表单引擎、流程引擎、仪表盘引擎，可满足企业 90% 以上的业务场景需求。无需编码，10 分钟，让大学生傻瓜式搭建自己的毕业设计！ ? 专注于开源，打造 "专业...

2026-01-09/ 64 次浏览/ 资讯

Hugging Face 发布 huggingface_hub v1.0 版本

hugging face 正式推出了其核心库 huggingface_hub 的 v1.0 里程碑版本，标志着开源机器学习基础设施迈入新阶段。该版本致力于为未来十年的开源 AI 生态系统奠定坚实基础，带来了一系列重大功能升级与架构调整。其中包括将底层 HTTP 客户端切换至 httpx，全面重构命令行工具（CLI），并正式启用 hf_xet 作为默认的文件传输协议。原有的 huggingface-cli 已被全新的 hf 命令取代，采用更清晰的“资源-动作...

2026-01-09/ 56 次浏览/ 资讯

【原理解析】HAMi × NVIDIA | GPU 拓扑感知调度实现详解

hami 社区在 v2.7.0 版本中正式上线了面向 nvidia gpu 的拓扑感知调度功能。该功能旨在应对高性能计算（hpc）与 ai 大模型训练中的多卡通信瓶颈，通过智能任务调度机制，将计算负载精准部署到物理连接最优、通信延迟最低的 gpu 组合上，显著提升任务执行效率和集群整体算力利用率。本文将在介绍功能亮点的基础上，深入源码层面，全面解析 hami 实现 nvidia gpu 拓扑感知调度的设计思路与关键技术。一、核心功能概览动态生成拓扑通信分值：...

2026-01-09/ 68 次浏览/ 资讯

蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K，适用于超长文本的的代码编程

蚂蚁百灵大模型团队近日正式开源了 ring-flash-linear-2.0-128k 模型，该模型特别适用于超长文本下的代码生成、编程任务以及智能 agent 等复杂应用场景。据悉，该模型采用线性注意力与标准注意力机制相结合的混合架构，在保证高效推理的同时实现了卓越的性能表现。通过融合成熟的 MoE（Mixture of Experts）设计与多项优化技术——包括 1/32 的专家激活比率和 MTP 层结构，Ring-flash-linear 能在仅激活 6.1B...

2026-01-09/ 58 次浏览/ 资讯

小红书联手中国人民大学研究团队开源通用智能体 DeepAgent

小红书联合中国人民大学研究团队近日推出了一款名为“deepagent”的开源通用ai智能体。该智能体具备可扩展的工具调用能力，能够在端到端的推理过程中，自主搜索并使用来自超过16,000个rapidapi接口中的合适工具，以完成各类常见任务。 DeepAgent提出了一种统一、连续且高度自主的推理框架，突破了传统分阶段代理工作流的局限。其主要特性包括：端到端深度推理：整个任务在一条连贯的思维链中完成，避免信息断裂动态工具发现与调用：无需预先设定可...

2026-01-09/ 56 次浏览/ 资讯

蚂蚁发布千亿参数开源全模态大模型 Ming-flash-omni-Preview

蚂蚁百灵大模型团队近日正式推出了全新开源全模态大模型——ming-flash-omni-preview，标志着首个参数规模突破千亿的全模态模型正式向社区开放。该模型基于ling 2.0的稀疏moe架构构建，总参数量达103b，激活参数仅为9b，在保持高效推理的同时显著提升了多模态理解与生成能力。相较于此前广受好评的Ming-lite-omni-1.5，新模型在图像、视频、语音等多个模态任务中实现了全面升级，尤其在可控图像生成、流式视频理解和高精度语音识别方面表现突出，...

2026-01-09/ 69 次浏览/ 资讯

复旦大学与美团联合发布 R-HORIZON，长链推理评测框架

复旦大学携手美团longcat共同发布了 r-horizon——首个专注于系统性评估与提升大型推理模型（lrms）长链推理能力的评测框架与训练方法。 R-HORIZON 创新性地提出了“问题组合”（Query Composition）策略，通过在不同问题之间建立逻辑依赖关系，将原本独立的任务转化为复杂的多阶段推理流程。以数学推理任务为例，该方法包含以下三个关键步骤：信息提取：从原始问题中抽取关键数值、变量等核心要素依赖构建：将前一个问题的解答结果...

2026-01-09/ 64 次浏览/ 资讯

Soul App 开源播客语音合成模型 SoulX-Podcast

近日，soul app ai团队（soul ai lab）正式对外开源其最新研发的播客语音合成模型——soulx-podcast。该模型专为多人、多轮对话场景设计，支持中文、英文、四川话、粤语等多种语言与方言，并具备丰富的副语言表达能力，可稳定生成超过60分钟自然流畅、角色切换精准、韵律变化生动的长时语音内容。除了在播客创作中表现出色，SoulX-Podcast在通用语音合成和声音克隆等应用场景下同样展现出卓越性能，带来更加真实且富有表现力的听觉体验。 Soul...

2026-01-09/ 60 次浏览/ 资讯

‹‹ ‹ 14 15 16 17 18 19 20 21 22 23 › ››