2018年8月13日
摘要: 本文介绍了如何利用Q-learning算法+值函数参数逼近来构建AI使其玩耍一个吃金币躲炸弹的游戏,结尾附录代码实现。 阅读全文
posted @ 2018-08-13 09:53 RonTang 阅读(6335) 评论(0) 推荐(1) 编辑