随笔档案「2024年12月25日」：人类反馈强化学习（Reinforcement Learning... - JackYang

2024年12月25日

人类反馈强化学习（Reinforcement Learning from Human Feedback, RLHF）

摘要：定义 RLHF是一种机器学习技术，它使智能体能够通过与环境的交互和接收来自人类提供的反馈来学习。在RLHF中，人类可以提供偏好、评价或直接指导以影响智能体的学习过程，帮助其理解哪些行为是期望的，哪些是不期望的。这种方法特别适用于那些难以定义精确奖励函数的任务，或者需要考虑人类主观偏好的任务。起源阅读全文

posted @ 2024-12-25 18:41 JackYang 阅读(578) 评论(0) 推荐(0)