会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
CocoML
博客园
首页
新随笔
联系
订阅
管理
2025年8月11日
Slime RL 框架源码剖析
摘要: 一、项目概述 SLIME 是一个用于大语言模型(LLM)后训练的强化学习(RL)框架,主要提供两个核心功能: 高性能训练:通过连接Megatron与SGLang,支持多种模式下的高效训练 灵活数据生成:通过自定义数据生成接口和基于服务器的引擎实现任意训练数据生成工作流 从 REDAME 来看,SLI
阅读全文
posted @ 2025-08-11 17:32 Aurelius84
阅读(243)
评论(0)
推荐(0)
公告