星空影视网

展开菜单

ROCK&ROLL:阿里双框架协同推动 Agentic RL 规模化应用

ROCK&ROLL:阿里双框架协同推动 Agentic RL 规模化应用
01 前言 roll是阿里巴巴未来生活实验与智能引擎团队开源的面向大模型的强化学习(rl)框架,该框架提供了完整的rl训练链路,支持模型通过与环境交互来学习任务解决策略。然而,roll当前缺失在环境服务层的标准化支持,虽然其提供了训练算法和模型接口,用户仍需自行构建和维护任务执行环境,无疑增加了使用门槛并限制了训练规模。 为解决这一难题,团队近期正式开源了ROCK——一个强大的Env沙箱,正式填补了ROLL生态中环境服务层的空白。它将提供: 标准化的环境接口:统一...