刘建平 - 标签 - Angry_Panda - 博客园

当前标签：刘建平

【转载】强化学习(十一) Prioritized Replay DQN Angry_Panda 2019-04-10 09:56 阅读:974 评论:0 推荐:0

【转载】强化学习（十）Double DQN (DDQN) Angry_Panda 2019-04-09 22:30 阅读:1678 评论:0 推荐:0

【转载】强化学习（九）Deep Q-Learning进阶之Nature DQN Angry_Panda 2019-04-09 18:27 阅读:625 评论:0 推荐:0

【转载】强化学习（八）价值函数的近似表示与Deep Q-Learning Angry_Panda 2019-04-09 10:14 阅读:488 评论:0 推荐:0

【转载】强化学习（七）时序差分离线控制算法Q-Learning Angry_Panda 2019-04-07 22:24 阅读:375 评论:0 推荐:0

【转载】强化学习（六）时序差分在线控制算法SARSA Angry_Panda 2019-04-07 18:26 阅读:483 评论:0 推荐:0

【转载】强化学习（五）用时序差分法（TD）求解 Angry_Panda 2019-04-07 10:17 阅读:458 评论:0 推荐:0

【转载】强化学习（四）用蒙特卡罗法（MC）求解 Angry_Panda 2019-04-06 23:43 阅读:343 评论:0 推荐:0

【转载】强化学习（三）用动态规划（DP）求解 Angry_Panda 2019-04-06 16:39 阅读:393 评论:0 推荐:0

【转载】强化学习（二）马尔科夫决策过程(MDP) Angry_Panda 2019-04-05 12:58 阅读:373 评论:0 推荐:0

【转载】强化学习（一）模型基础 Angry_Panda 2019-04-02 11:27 阅读:472 评论:0 推荐:0

公告

导航