会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
红豆生南国 是很遥远的事情
种豆南山下 github
博客园
首页
新随笔
联系
订阅
管理
评论排行榜
大模型-llamafactory ppo训练模型,不使用llm作为reward模型 -73
jack-chen666 2025-06-24 09:59
阅读:926
评论:1
推荐:0
大模型-qwen3 模型结构解读-66
jack-chen666 2025-06-19 20:19
阅读:4730
评论:1
推荐:1
公告