摘要: 简介: PGMRL: PGMRL就是把RL问题建模成一个概率图模型,如下图所示: 然后通过variational inference的方法进行学习: PGMRL给RL问题的表示给了一个范例,对解决很多RL新问题提供了一种思路和工具。 Bayesian RL: 主要是对RL的reward functi 阅读全文
posted @ 2019-04-04 13:50 Shiyu_Huang 阅读(439) 评论(0) 推荐(0)