摘要: DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法。主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现。下面给出公式,并定义一个新的变量: $$ q(s_t, a_t)=v(s_t)+A(s_t, a_t) $$ 也 阅读全文
posted @ 2019-12-13 13:09 虔诚的树 阅读(1647) 评论(0) 推荐(0) 编辑