随笔档案「2019年3月28日」：Deep Learning专栏--强化学习之MDP、Bellman方程（1） ... - 蓝鲸王子

2019年3月28日

摘要：本文主要介绍强化学习的一些基本概念：包括MDP、Bellman方程等, 并且讲述了如何从 MDP 过渡到 Reinforcement Learning。 1. 强化学习基本概念这里还是放上David Silver的课程的图，可以很清楚的看到整个交互过程。这就是人与环境交互的一种模型化表示，在每个时阅读全文

posted @ 2019-03-28 16:53 蓝鲸王子阅读(4282) 评论(0) 推荐(2)

公告