会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
黄世宇@小鹏汽车,OpenRL Lab负责人,强化学习,LLM,VLM, GUI Agent, Omni
[
OpenRL
][
知乎
][
GitHub
][
Linkedin
]
如果你对人工智能前沿感兴趣,欢迎联系并加入我们!
博客园
首页
新随笔
联系
管理
2019年4月4日
Bayesian RL and PGMRL
摘要: 简介: PGMRL: PGMRL就是把RL问题建模成一个概率图模型,如下图所示: 然后通过variational inference的方法进行学习: PGMRL给RL问题的表示给了一个范例,对解决很多RL新问题提供了一种思路和工具。 Bayesian RL: 主要是对RL的reward functi
阅读全文
posted @ 2019-04-04 13:50 Shiyu_Huang
阅读(439)
评论(0)
推荐(0)