随笔分类 -  人工智能—数据集

摘要:基础模型严重依赖大规模、高质量人工标注数据来学习适应新任务、领域。为解决这一难题,来自北京大学、MIT等机构的研究者们提出了一种名为「合成数据强化学习」(Synthetic Data RL)的通用框架。该框架仅需用户提供一个简单的任务定义,即可全自动地生成高质量合成数据。结合自动强化学习(RL)微调 阅读全文
posted @ 2025-06-25 10:46 The-Chosen-One 阅读(169) 评论(0) 推荐(0)