摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10146554.html 说明:将之前 q-learning 实现的例一,用 saras 重新写了一遍。具体问题这里就不多说了。 0. q-learning 与 saras 伪代码的对比 图片来 阅读全文
posted @ 2018-12-19 22:21 罗兵 阅读(1563) 评论(0) 推荐(0) 编辑
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10145797.html 0.说明 这里提供了二维迷宫问题的一个比较通用的模板,拿到后需要修改的地方非常少。 对于任意的二维迷宫的 class Agent,只需修改三个地方:MAZE_R, MA 阅读全文
posted @ 2018-12-19 20:31 罗兵 阅读(4462) 评论(4) 推荐(2) 编辑
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10143579.html 感谢pengdali,本文的 class Maze 参考了他的博客,地址:https://blog.csdn.net/pengdali/article/details/ 阅读全文
posted @ 2018-12-19 15:29 罗兵 阅读(4309) 评论(0) 推荐(0) 编辑