当 ai 模型体量不断攀升,算力需求随之呈现指数级飙升,计算资源调度效率低下、模型交付流程复杂、多云环境运维困难等问题日益凸显,已然成为阻碍 ai 技术广泛应用的核心瓶颈。而云原生 ai 技术凭借其出色的弹性伸缩能力与高度可扩展性,正为破解这些难题提供了一条高效可行的路径 —— 在此背景下,全球开源技术峰会特别设立 云原生 ai 论坛,致力于为行业技术人打造一个面对面交流思想、共筑云原生 ai 生态的开放平台。
GOTC 2025 立即报名
云原生 AI 论坛
云...
PyTorch 基金会近日宣布,正式将 Ray 纳入其托管项目阵容。Ray 最初由 Anyscale 团队打造,是一款开源的分布式计算框架,广泛用于支持各类 AI 工作负载,涵盖数据预处理、大规模模型训练以及高效推理等关键环节。
据官方介绍,在当前激烈的 AI 技术竞争中,工程团队常常面临系统架构分散、依赖手工集成等问题,导致开发流程复杂、资源利用率低下,进而拖慢产品上线节奏。Ray 的设计目标正是为了解决这些分布式计算中的瓶颈问题,推动 AI 技术的快速迭代与创新...
10月27日,消息称nvidia下一代gpu架构代号为rubin,预计将延续高性能计算与图形处理融合的设计路线。其中,面向数据中心的加速卡预计将于明年亮相,而消费级游戏显卡则可能要等到后年才能发布。
值得注意的是,NVIDIA已提前启动对Rubin架构的驱动适配工作,开源的Nova内核驱动现已初步加入对该架构的支持。
近期,NVIDIA向Linux社区提交的一项补丁名为“gpu: nova: add boot42 support for next-gen GPUs...