我的随笔

共13页: 1 2 3 4 5 6 7 8 9 下一页 末页 
强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS) 刘建平Pinard 2019-03-04 17:09 阅读:507 评论:2  
强化学习(十七) 基于模型的强化学习与Dyna算法框架 刘建平Pinard 2019-02-15 20:22 阅读:541 评论:7  
强化学习(十六) 深度确定性策略梯度(DDPG) 刘建平Pinard 2019-02-01 19:42 阅读:685 评论:10  
强化学习(十五) A3C 刘建平Pinard 2019-01-29 18:09 阅读:621 评论:12  
强化学习(十四) Actor-Critic 刘建平Pinard 2019-01-15 17:46 阅读:955 评论:5  
强化学习(十三) 策略梯度(Policy Gradient) 刘建平Pinard 2018-12-18 18:04 阅读:2282 评论:30  
强化学习(十二) Dueling DQN 刘建平Pinard 2018-11-08 14:04 阅读:1812 评论:6  
强化学习(十一) Prioritized Replay DQN 刘建平Pinard 2018-10-16 16:46 阅读:2146 评论:7  
强化学习(十)Double DQN (DDQN) 刘建平Pinard 2018-10-12 16:52 阅读:3086 评论:2  
强化学习(九)Deep Q-Learning进阶之Nature DQN 刘建平Pinard 2018-10-08 20:40 阅读:2099 评论:0  
共13页: 1 2 3 4 5 6 7 8 9 下一页 末页