2025 年 11月 20 日随笔档案 - AI-Frontiers

2025年11月20日

摘要：原文: https://mp.weixin.qq.com/s/4_6CBXMJhqmiYKSzsAXncg 人类反馈强化学习（Reinforcement Learning from Human Feedback，RLHF)是释放大语言模型（LLM）巨大潜力的关键，OpenAI在2020年发布的GPT 阅读全文

posted @ 2025-11-20 14:48 AI-Frontiers 阅读(199) 评论(0) 推荐(1)

AI-Frontiers 公#众#号：AI-Frontiers

分享AI前沿进展、底层原理和行业应用

公告