Omni-Infer v0.4.2 正式上线,带来面向超大规模 MoE 模型的高效推理加速方案
本次版本主要更新亮点如下:
核心功能升级
新增对 DeepSeek-v3.2-EXP with DSA 的全面支持
推出 Omni Proxy,实现高性能的 Prefill 与 Decode 分离调度(PD分离)
引入 KV offload 技术,结合主机内存扩展的 KVM 机制,使 MLA 场景下的 KV blocks 容量提升超过百倍,显著增强长上下文及多轮对话处...
anthropic 推出了其最新一代 ai 模型 claude sonnet 4.5,宣称该模型在代码生成、构建高阶 ai agent 以及操作系统级任务执行方面处于全球领先地位。
Claude Sonnet 4.5 在多项核心评估基准上取得了突破性进展。其在 SWE-bench Verified 测试中斩获 77.2% 的高分,创下当前行业新纪录;而在 OSWorld 的实际任务完成率方面,性能从此前的 42.2% 大幅提升至 61.4%。
不仅如此,在逻辑推理...
volcano v1.13 版本正式发布。本次更新在多方面进行了功能增强,为用户提供更完善的云原生批量计算解决方案。
新版本主要亮点包括:新增对大模型推理LWS的支持;新增定时任务管理能力;提供更灵活的网络拓扑发现机制,并增强对主流AI计算框架的兼容性。同时在混部架构上实现了重要改进,提升了在不同环境中的部署灵活性。这些增强功能共同提升了Volcano在复杂工作负载管理中的实用性和易用性,旨在打造更高效、更稳定的大规模计算平台,为AI时代的基础设施提供关键调度支撑。...
上海人工智能实验室 opendatalab 团队近日正式推出 mineru2.5 技术白皮书,全面介绍其模型结构、训练方法、数据处理流程及多项评测表现。
MinerU2.5 是一款具备 12 亿参数的解耦式视觉-语言模型,专为高分辨率文档理解而设计。项目团队同步上线了官方 Demo,用户可在线体验其强大功能。
该模型采用创新的两阶段解析机制:第一阶段对降采样图像进行整体版面布局分析;第二阶段则在原始分辨率下,针对局部区域实现文本、数学公式与表格的精细化识别。这一架...
近日,ruby 社区掀起一场围绕 rubygems 与 bundler 的“控制权之争”。
作为 Ruby 生态中最关键的包管理与依赖解决方案,这两项工具的主导权在未征得长期维护者同意的情况下,被 Ruby Central 单方面全面接管:包括将 RubyGems 的 GitHub 企业组织重命名为 “Ruby Central”,并大规模移除核心维护者的访问权限(如停用邮件账户、撤销对 RubyGems 的所有权),事件迅速引发社区震动。
RubyGems 和 B...
2025 年 9 月 24 日,rwkv7-g1a 2.9b 推理模型正式开源,进一步推动纯 rnn 架构在语言理解与生成方面的能力边界。
该模型基于 RWKV7-G1 2.9B 持续训练了 1T tokens 的高质量数据,在多个维度上实现显著性能跃升。
模型客观评测表现
英文及多语言能力
在同参数规模的开源模型中,RWKV7-G1a 2.9B 在基础英语和跨语言任务上的表现更为出色:
作为一个未经针对性“刷榜”优化的纯预训练基座模型,其 MMLU 分数提升至...
9 月 29 日,深度求索正式推出 deepseek v3.2-exp 模型(实验性版本),显著提升了长文本处理效率,并宣布 api 调用成本下降超过 50%。在此次发布的公告中,有这样一段值得关注的内容:
在新模型的研发过程中,需设计并实现大量全新的 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持更深层次的技术探索。
据悉,TileLang 是一种轻量级的领域专用语言(DSL),专注于简化在 GPU 和 NPU 等加速器上的算子开发。其核心...
罗技首款支持触觉反馈的鼠标问世,让高效操作在指尖间流畅跃动
罗技推出旗下首款具备可自定义触觉反馈功能的鼠标,专为追求极致操控与效率的专业人士量身打造。
通过LogiOptions+ 软件提供的数字化界面——ActionsRing 智能行动环,用户可显著优化日常操作流程,实测数据显示,工作时间最多可节省约33%,重复性鼠标动作减少高达约63%。*
更强信号的射频芯片搭配优化后的天线设计,使无线连接性能相较前代提升近两倍,带来更稳定、低延迟的操作体验。
MX Mast...
10 月 2 日消息,《商业内幕》今日披露,微软员工对公司推出的多款 copilot 产品可能引发用户混淆表示担忧,而内部会议录音显示,公司已着手制定应对策略。
在最近举行的一次全员大会上,有员工提问:如何帮助用户更清晰地认识到市面上存在多个不同的 Copilot 应用。
注:目前微软在移动应用商店上线了两款名为 Copilot 的应用程序,其一是由 Microsoft AI 团队打造的面向消费者的版本,另一款则是更名后的 Microsoft Office 应用,现已...
据数毛社(Digital Foundry)发布的最新技术拆解,任天堂Switch2已确认集成两种英伟达DLSS超分辨率技术,其中包含此前传闻中专为移动平台优化的“轻量级”版本。
通过对《赛博朋克2077》《街头霸王6》以及《霍格沃茨遗产》等首批适配Switch2的游戏进行深入分析,技术团队发现这台新主机实际上运行着两套独立的DLSS处理逻辑。第一种方案与PC平台所采用的CNN模型高度相似,在图像重建、动态抗锯齿和视差补偿方面表现接近,目前主要用于将输出提升至1080...