该文被密码保护。 阅读全文
posted @ 2016-06-27 17:28
AHU-WangXiao
阅读(25)
评论(0)
推荐(0)
摘要:
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common的,是否对性能有害,以及是否 阅读全文
posted @ 2016-06-27 15:39
AHU-WangXiao
阅读(6827)
评论(0)
推荐(0)

浙公网安备 33010602011771号