【论文解读】RLAIF基于人工智能反馈的强化学习
摘要:
【论文解读】RLAIF基于人工智能反馈的强化学习 一、简要介绍 人类反馈强化学习(RLHF)可以有效地将大型语言模型(LLM)与人类偏好对齐,但收集高质量的人类偏好标签是一个关键瓶颈。论文进行了一场RLHF与来自人工智能反馈的RL的比较(RLAIF) -一种由现成的LLM代替人类标记偏好的技术,论文 阅读全文
posted @ 2023-10-27 15:18 合合技术团队 阅读(173) 评论(0) 推荐(0)
浙公网安备 33010602011771号