当前标签:刘建平

【转载】 强化学习(十一) Prioritized Replay DQN Angry_Panda 2019-04-10 09:56 阅读:974 评论:0 推荐:0   
【转载】 强化学习(十)Double DQN (DDQN) Angry_Panda 2019-04-09 22:30 阅读:1678 评论:0 推荐:0   
【转载】 强化学习(九)Deep Q-Learning进阶之Nature DQN Angry_Panda 2019-04-09 18:27 阅读:625 评论:0 推荐:0   
【转载】 强化学习(八)价值函数的近似表示与Deep Q-Learning Angry_Panda 2019-04-09 10:14 阅读:488 评论:0 推荐:0   
【转载】 强化学习(七)时序差分离线控制算法Q-Learning Angry_Panda 2019-04-07 22:24 阅读:375 评论:0 推荐:0   
【转载】 强化学习(六)时序差分在线控制算法SARSA Angry_Panda 2019-04-07 18:26 阅读:483 评论:0 推荐:0   
【转载】 强化学习(五)用时序差分法(TD)求解 Angry_Panda 2019-04-07 10:17 阅读:458 评论:0 推荐:0   
【转载】 强化学习(四)用蒙特卡罗法(MC)求解 Angry_Panda 2019-04-06 23:43 阅读:343 评论:0 推荐:0   
【转载】 强化学习(三)用动态规划(DP)求解 Angry_Panda 2019-04-06 16:39 阅读:393 评论:0 推荐:0   
【转载】 强化学习(二)马尔科夫决策过程(MDP) Angry_Panda 2019-04-05 12:58 阅读:373 评论:0 推荐:0   
【转载】 强化学习(一)模型基础 Angry_Panda 2019-04-02 11:27 阅读:472 评论:0 推荐:0   

导航