蚂蚁百灵大模型团队近日正式开源了高效推理模型 ring-mini-sparse-2.0-exp,该模型基于全新设计的 ling 2.0 架构,专为长序列解码任务优化,创新性地结合了高稀疏度的 mixture of expert(moe)结构与稀疏注意力机制。
据团队介绍,通过架构与推理系统的深度协同优化,该模型在处理复杂长序列推理任务时,吞吐量相较原始版本 Ring-mini-2.0 提升近 3 倍。同时,在多个高难度推理基准测试中持续保持领先水平(SOTA),为开源社...
月之暗面(moonshot ai)近日推出了自研的开源 agentic coding 工具——kimi cli 技术预览版。
据悉,Kimi CLI 以类 Shell 的界面作为原生交互形态,用户可通过 Ctrl-K 快捷键在 Agent 模式与传统 Shell 命令模式之间自由切换。此外,该工具已支持 ACP 协议,未来可兼容多种 ACP 客户端,从而为用户提供更贴近图形化开发习惯的操作体验。
如需了解 Kimi CLI 技术预览版的详细使用方法,可查阅官方文档...
项目介绍
敲敲云是一款免费的企业级零代码平台,用户无需编码,即可拖拽快速搭建出复杂业务系统,5 分钟可搭建一套 crm 系统、进销存系统等! 她集成了零代码应用、ai 应用平台和 ai 知识库,可帮助企业快速搭建个性化业务应用 和 ai 应用、ai 知识库、ai 聊天助手! 敲敲云拥有完善的应用搭建能力、表单引擎、流程引擎、仪表盘引擎,可满足企业 90% 以上的业务场景需求。
无需编码,10 分钟,让大学生傻瓜式搭建自己的毕业设计!
? 专注于开源,打造 "专业...
近日,digital foundry(数毛社)对ps5及ps5 pro新增的节能模式进行了深入技术解析,引发了业界对未来ps6掌机形态设备的广泛猜测。分析认为,索尼此次推出的节能选项,可能正在为下一代便携式playstation设备铺路——试图在维持品牌标志性画质与玩法体验的同时,实现性能、散热与电池续航之间的理想平衡。
据数毛社研究,这一节能配置或预示着未来PS6便携版将采用双模运行机制。目前主机上的节能模式已独立于标准模式和Pro模式之外,成为开发者新的优化目标...
hugging face 正式推出了其核心库 huggingface_hub 的 v1.0 里程碑版本,标志着开源机器学习基础设施迈入新阶段。
该版本致力于为未来十年的开源 AI 生态系统奠定坚实基础,带来了一系列重大功能升级与架构调整。其中包括将底层 HTTP 客户端切换至 httpx,全面重构命令行工具(CLI),并正式启用 hf_xet 作为默认的文件传输协议。
原有的 huggingface-cli 已被全新的 hf 命令取代,采用更清晰的“资源-动作...
hami 社区在 v2.7.0 版本中正式上线了面向 nvidia gpu 的 拓扑感知调度 功能。该功能旨在应对高性能计算(hpc)与 ai 大模型训练中的多卡通信瓶颈,通过智能任务调度机制,将计算负载精准部署到物理连接最优、通信延迟最低的 gpu 组合上,显著提升任务执行效率和集群整体算力利用率。本文将在介绍功能亮点的基础上,深入源码层面,全面解析 hami 实现 nvidia gpu 拓扑感知调度的设计思路与关键技术。
一、核心功能概览
动态生成拓扑通信分值:...
对于台式机用户而言,耳机或音箱通常需要插入主板后部i/o面板上的3.5mm音频接口,这一点大家基本都清楚。然而,在许多主板的音频接口附近,还配备了一个不起眼的方形接口,不少人对它的用途一头雾水,即便是资深diy玩家,真正使用过的人恐怕也不多——它就是spdif光纤输出接口。
SPDIF(Sony/Philips Digital Interface Format,索尼/飞利浦数字接口格式)是由索尼与飞利浦共同制定的一种数字音频传输标准,旨在实现各类音频设备之间的高质量数字...
torna v2.1.2 正式上线,打造企业级接口文档管理新体验。
Torna在保留传统文档工具核心功能的基础上,针对Swagger等工具的局限性进行了全面优化与功能拓展,提供更高效、更便捷的API文档解决方案。
直击文档管理难题
对Swagger的文档展示与调试界面体验不满意
厌烦使用大量侵入式注解影响代码整洁
希望通过javadoc风格注释自动生成接口文档并支持在线调试
期望实现公司所有项目接口文档的集中化管理
需要将多个项目的接口文档共享给外部合作方查阅...
Zoom创始人兼首席执行官袁征(Eric Yuan)在近期举办的TechCrunch Disrupt 2025大会上表示,随着AI助手的广泛应用,人类有望在未来五年内摆脱传统五日工作制,逐步过渡到每周仅需工作三至四天的全新模式。
他深入分享了Zoom如何将人工智能全面整合进其产品体系,并勾勒出一个由“数字分身”支撑的未来办公场景。袁征透露,今年他已在一次公司财报电话会议中,首次启用AI生成的“数字孪生”(digital twin)代表自己发言。这一尝试不仅证明了技术...
蚂蚁百灵大模型团队近日正式开源了 ring-flash-linear-2.0-128k 模型,该模型特别适用于超长文本下的代码生成、编程任务以及智能 agent 等复杂应用场景。
据悉,该模型采用线性注意力与标准注意力机制相结合的混合架构,在保证高效推理的同时实现了卓越的性能表现。通过融合成熟的 MoE(Mixture of Experts)设计与多项优化技术——包括 1/32 的专家激活比率和 MTP 层结构,Ring-flash-linear 能在仅激活 6.1B...