会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Mira's Blog
博客园
首页
新随笔
联系
订阅
管理
2024年3月15日
【Coursera GenAI with LLM】 Week 3 Reinforcement Learning from Human Feedback Class Notes
摘要: Helpful? Honest? Harmless? Make sure AI response in those 3 ways. If not, we need RLHF is reduce the toxicity of the LLM. Reinforcement learning: is a
阅读全文
posted @ 2024-03-15 12:15 MiraMira
阅读(51)
评论(0)
推荐(0)
公告