摘要: GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ 阅读全文
posted @ 2025-10-21 12:28 qlhh 阅读(157) 评论(0) 推荐(0)