摘要: 一、项目概述 SLIME 是一个用于大语言模型(LLM)后训练的强化学习(RL)框架,主要提供两个核心功能: 高性能训练:通过连接Megatron与SGLang,支持多种模式下的高效训练 灵活数据生成:通过自定义数据生成接口和基于服务器的引擎实现任意训练数据生成工作流 从 REDAME 来看,SLI 阅读全文
posted @ 2025-08-11 17:32 Aurelius84 阅读(243) 评论(0) 推荐(0)