2016 年 6月 27 日随笔档案 - AHU-WangXiao

2016年6月27日

该文被密码保护。阅读全文

posted @ 2016-06-27 17:28 AHU-WangXiao 阅读(25) 评论(0) 推荐(0) 编辑

论文笔记之：Deep Reinforcement Learning with Double Q-learning

摘要： Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上，之前是不知道是否这样的过高估计是 common的，是否对性能有害，以及是否阅读全文

posted @ 2016-06-27 15:39 AHU-WangXiao 阅读(6704) 评论(0) 推荐(0) 编辑

The Blog of Xiao Wang

Associate Professor, School of Computer Science and Technology, Anhui University, Email: xiaowang@ahu.edu.cn

公告