该文被密码保护。 阅读全文
posted @ 2016-06-27 17:28 AHU-WangXiao 阅读(25) 评论(0) 推荐(0) 编辑
摘要: Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common的,是否对性能有害,以及是否 阅读全文
posted @ 2016-06-27 15:39 AHU-WangXiao 阅读(6704) 评论(0) 推荐(0) 编辑