The categories of Reinforcement Learning 强化学习分类 - 李凤莲Lois_tyut - 博客园

代码改变世界

The categories of Reinforcement Learning 强化学习分类

2018-02-02 21:31 李凤莲Lois_tyut 阅读(322) 评论(0) 收藏举报

RL分为三大类：

（1）通过行为的价值来选取特定行为的方法,具体包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network；

（2）直接输出行为的 policy gradients；

（3）了解所处的环境, 想象出一个虚拟的环境并从虚拟的环境中学习。

另一种分类方式：

Model-free and Model-based

Model-free：不理解环境

刷新页面返回顶部