摘要: 本文主要介绍强化学习的一些基本概念:包括MDP、Bellman方程等, 并且讲述了如何从 MDP 过渡到 Reinforcement Learning。 1. 强化学习基本概念 这里还是放上David Silver的课程的图,可以很清楚的看到整个交互过程。这就是人与环境交互的一种模型化表示,在每个时 阅读全文
posted @ 2019-03-28 16:53 蓝鲸王子 阅读(3404) 评论(0) 推荐(2) 编辑