星空影视网

展开菜单

Omni-Infer v0.4.2 已经发布,超大规模 MoE 模型推理加速技术

Omni-Infer v0.4.2 已经发布,超大规模 MoE 模型推理加速技术
Omni-Infer v0.4.2 正式上线,带来面向超大规模 MoE 模型的高效推理加速方案 本次版本主要更新亮点如下: 核心功能升级 新增对 DeepSeek-v3.2-EXP with DSA 的全面支持 推出 Omni Proxy,实现高性能的 Prefill 与 Decode 分离调度(PD分离) 引入 KV offload 技术,结合主机内存扩展的 KVM 机制,使 MLA 场景下的 KV blocks 容量提升超过百倍,显著增强长上下文及多轮对话处...

Claude Sonnet 4.5 发布,全球最强的代码模型

Claude Sonnet 4.5 发布,全球最强的代码模型
anthropic 推出了其最新一代 ai 模型 claude sonnet 4.5,宣称该模型在代码生成、构建高阶 ai agent 以及操作系统级任务执行方面处于全球领先地位。 Claude Sonnet 4.5 在多项核心评估基准上取得了突破性进展。其在 SWE-bench Verified 测试中斩获 77.2% 的高分,创下当前行业新纪录;而在 OSWorld 的实际任务完成率方面,性能从此前的 42.2% 大幅提升至 61.4%。 不仅如此,在逻辑推理...

Volcano v1.13 发布,大模型训练与推理等调度能力全面增强

Volcano v1.13 发布,大模型训练与推理等调度能力全面增强
volcano v1.13 版本正式发布。本次更新在多方面进行了功能增强,为用户提供更完善的云原生批量计算解决方案。 新版本主要亮点包括:新增对大模型推理LWS的支持;新增定时任务管理能力;提供更灵活的网络拓扑发现机制,并增强对主流AI计算框架的兼容性。同时在混部架构上实现了重要改进,提升了在不同环境中的部署灵活性。这些增强功能共同提升了Volcano在复杂工作负载管理中的实用性和易用性,旨在打造更高效、更稳定的大规模计算平台,为AI时代的基础设施提供关键调度支撑。...

OpenDataLab 发布文档解析视觉-语言模型 MinerU2.5 技术报告

OpenDataLab 发布文档解析视觉-语言模型 MinerU2.5 技术报告
上海人工智能实验室 opendatalab 团队近日正式推出 mineru2.5 技术白皮书,全面介绍其模型结构、训练方法、数据处理流程及多项评测表现。 MinerU2.5 是一款具备 12 亿参数的解耦式视觉-语言模型,专为高分辨率文档理解而设计。项目团队同步上线了官方 Demo,用户可在线体验其强大功能。 该模型采用创新的两阶段解析机制:第一阶段对降采样图像进行整体版面布局分析;第二阶段则在原始分辨率下,针对局部区域实现文本、数学公式与表格的精细化识别。这一架...

Ruby 生态核心开源项目 RubyGems 爆发“控制权争夺战”

Ruby 生态核心开源项目 RubyGems 爆发“控制权争夺战”
近日,ruby 社区掀起一场围绕 rubygems 与 bundler 的“控制权之争”。 作为 Ruby 生态中最关键的包管理与依赖解决方案,这两项工具的主导权在未征得长期维护者同意的情况下,被 Ruby Central 单方面全面接管:包括将 RubyGems 的 GitHub 企业组织重命名为 “Ruby Central”,并大规模移除核心维护者的访问权限(如停用邮件账户、撤销对 RubyGems 的所有权),事件迅速引发社区震动。 RubyGems 和 B...

RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力

RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
2025 年 9 月 24 日,rwkv7-g1a 2.9b 推理模型正式开源,进一步推动纯 rnn 架构在语言理解与生成方面的能力边界。 该模型基于 RWKV7-G1 2.9B 持续训练了 1T tokens 的高质量数据,在多个维度上实现显著性能跃升。 模型客观评测表现 英文及多语言能力 在同参数规模的开源模型中,RWKV7-G1a 2.9B 在基础英语和跨语言任务上的表现更为出色: 作为一个未经针对性“刷榜”优化的纯预训练基座模型,其 MMLU 分数提升至...

DeepSeek 拥抱国产 GPU 编程语言 TileLang

DeepSeek 拥抱国产 GPU 编程语言 TileLang
9 月 29 日,深度求索正式推出 deepseek v3.2-exp 模型(实验性版本),显著提升了长文本处理效率,并宣布 api 调用成本下降超过 50%。在此次发布的公告中,有这样一段值得关注的内容: 在新模型的研发过程中,需设计并实现大量全新的 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持更深层次的技术探索。 据悉,TileLang 是一种轻量级的领域专用语言(DSL),专注于简化在 GPU 和 NPU 等加速器上的算子开发。其核心...

开启高效新纪元:罗技大师系列MX Master 4 高性能无线鼠标全新发布

开启高效新纪元:罗技大师系列MX Master 4 高性能无线鼠标全新发布
罗技首款支持触觉反馈的鼠标问世,让高效操作在指尖间流畅跃动 罗技推出旗下首款具备可自定义触觉反馈功能的鼠标,专为追求极致操控与效率的专业人士量身打造。 通过LogiOptions+ 软件提供的数字化界面——ActionsRing 智能行动环,用户可显著优化日常操作流程,实测数据显示,工作时间最多可节省约33%,重复性鼠标动作减少高达约63%。* 更强信号的射频芯片搭配优化后的天线设计,使无线连接性能相较前代提升近两倍,带来更稳定、低延迟的操作体验。 MX Mast...

微软 Copilot 产品线混乱引员工担忧,纳德拉称要根据使用场景区分

微软 Copilot 产品线混乱引员工担忧,纳德拉称要根据使用场景区分
10 月 2 日消息,《商业内幕》今日披露,微软员工对公司推出的多款 copilot 产品可能引发用户混淆表示担忧,而内部会议录音显示,公司已着手制定应对策略。 在最近举行的一次全员大会上,有员工提问:如何帮助用户更清晰地认识到市面上存在多个不同的 Copilot 应用。 注:目前微软在移动应用商店上线了两款名为 Copilot 的应用程序,其一是由 Microsoft AI 团队打造的面向消费者的版本,另一款则是更名后的 Microsoft Office 应用,现已...

性能省一半!数毛社发现Switch2暗藏两种DLSS模式

性能省一半!数毛社发现Switch2暗藏两种DLSS模式
据数毛社(Digital Foundry)发布的最新技术拆解,任天堂Switch2已确认集成两种英伟达DLSS超分辨率技术,其中包含此前传闻中专为移动平台优化的“轻量级”版本。 通过对《赛博朋克2077》《街头霸王6》以及《霍格沃茨遗产》等首批适配Switch2的游戏进行深入分析,技术团队发现这台新主机实际上运行着两套独立的DLSS处理逻辑。第一种方案与PC平台所采用的CNN模型高度相似,在图像重建、动态抗锯齿和视差补偿方面表现接近,目前主要用于将输出提升至1080...