摘要: 在强化学习(九)Deep Q-Learning进阶之Nature DQN中,我们讨论了Nature DQN的算法流程,它通过使用两个相同的神经网络,以解决数据样本和网络训练之前的相关性。但是还是有其他值得优化的点,文本就关注于Nature DQN的一个改进版本: Double DQN算法(以下简称D 阅读全文
posted @ 2018-10-12 16:52 刘建平Pinard 阅读(102233) 评论(77) 推荐(8) 编辑