摘要:
本文用于基本入门理解。 强化学习的基本理论 : R, S, A 这些就不说了。 先设想两个场景: 一。 1个 5x5 的 格子图, 里面有一个目标点, 2个死亡点二。 一个迷宫, 一个出发点, 3处 分叉点, 5个死角, 1条活路Q-learning 的概念 其实就是一个算法, 数学的,或者软件程序 阅读全文
posted @ 2017-10-30 11:32 hylas 阅读(5503) 评论(1) 推荐(0)
|
|||
|
摘要:
本文用于基本入门理解。 强化学习的基本理论 : R, S, A 这些就不说了。 先设想两个场景: 一。 1个 5x5 的 格子图, 里面有一个目标点, 2个死亡点二。 一个迷宫, 一个出发点, 3处 分叉点, 5个死角, 1条活路Q-learning 的概念 其实就是一个算法, 数学的,或者软件程序 阅读全文
posted @ 2017-10-30 11:32 hylas 阅读(5503) 评论(1) 推荐(0) |
|||