会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
伊犁纯流莱
博客园
首页
新随笔
联系
订阅
管理
2024年12月29日
RL中on-policy和off-policy的本质区别/重要性采样
摘要: 讨论了on-policy和off-policy的本质区别。说明了off-policy MC和off-policy TD是如何利用重要性采样的,以及为什么Q-learning不需要进行重要性采样。
阅读全文
posted @ 2024-12-29 20:35 伊犁纯流莱
阅读(163)
评论(0)
推荐(0)
公告