【转载】 强化学习(十一) Prioritized Replay DQN
Angry_Panda 2019-04-10 09:56
阅读:974
评论:0
推荐:0
当前标签:刘建平
【转载】 强化学习(十)Double DQN (DDQN)
Angry_Panda 2019-04-09 22:30
阅读:1678
评论:0
推荐:0
【转载】 强化学习(九)Deep Q-Learning进阶之Nature DQN
Angry_Panda 2019-04-09 18:27
阅读:625
评论:0
推荐:0
【转载】 强化学习(八)价值函数的近似表示与Deep Q-Learning
Angry_Panda 2019-04-09 10:14
阅读:488
评论:0
推荐:0
【转载】 强化学习(七)时序差分离线控制算法Q-Learning
Angry_Panda 2019-04-07 22:24
阅读:375
评论:0
推荐:0
【转载】 强化学习(六)时序差分在线控制算法SARSA
Angry_Panda 2019-04-07 18:26
阅读:483
评论:0
推荐:0
【转载】 强化学习(五)用时序差分法(TD)求解
Angry_Panda 2019-04-07 10:17
阅读:458
评论:0
推荐:0
【转载】 强化学习(四)用蒙特卡罗法(MC)求解
Angry_Panda 2019-04-06 23:43
阅读:343
评论:0
推荐:0
【转载】 强化学习(三)用动态规划(DP)求解
Angry_Panda 2019-04-06 16:39
阅读:393
评论:0
推荐:0
【转载】 强化学习(二)马尔科夫决策过程(MDP)
Angry_Panda 2019-04-05 12:58
阅读:373
评论:0
推荐:0
【转载】 强化学习(一)模型基础
Angry_Panda 2019-04-02 11:27
阅读:472
评论:0
推荐:0
浙公网安备 33010602011771号