2019 年 4月 4 日随笔档案 - Shiyu_Huang

2019年4月4日

摘要：简介： PGMRL: PGMRL就是把RL问题建模成一个概率图模型，如下图所示：然后通过variational inference的方法进行学习： PGMRL给RL问题的表示给了一个范例，对解决很多RL新问题提供了一种思路和工具。 Bayesian RL: 主要是对RL的reward functi 阅读全文

posted @ 2019-04-04 13:50 Shiyu_Huang 阅读(439) 评论(0) 推荐(0)

黄世宇@小鹏汽车，OpenRL Lab负责人，强化学习，LLM，VLM, GUI Agent, Omni[OpenRL][知乎][GitHub][Linkedin]如果你对人工智能前沿感兴趣，欢迎联系并加入我们！

黄世宇@小鹏汽车，OpenRL Lab负责人，强化学习，LLM，VLM, GUI Agent, Omni
[OpenRL][知乎][GitHub][Linkedin]
如果你对人工智能前沿感兴趣，欢迎联系并加入我们！