6. Double DQN、Prioritized DQN、Dueling DQN
摘要:
本篇介绍三种DQN的变体,分别是从参数更新部分改进的Double DQN,从经验回放部分改进的Prioritized DQN,从神经网络结构部分改进的Dueling DQN。 Double DQN 上一篇提到的DQN是基于Q-learning,更新也是基于贪婪算法,$Q \leftarrow Q + 阅读全文
posted @ 2019-01-23 20:41 yijun0730 阅读(1699) 评论(0) 推荐(0)
浙公网安备 33010602011771号