机器学习资料


小鸟:https://github.com/yenchenlin/DeepLearningFlappyBird

五子棋:https://github.com/ArinoWang/AlphaZero_Gomoku-master

强化学习方法汇总
https://zhuanlan.zhihu.com/p/24806654

Q – LEARNLING:
一个 Q-learning 算法的简明教程
https://blog.csdn.net/itplus/article/details/9361915

DQN:
DQN 从入门到放弃1 DQN与增强学习
https://zhuanlan.zhihu.com/p/21262246?refer=intelligentunit

DQN 从入门到放弃2 增强学习与MDP
https://zhuanlan.zhihu.com/p/21292697?refer=intelligentunit

DQN 从入门到放弃3 价值函数与Bellman方程
https://zhuanlan.zhihu.com/p/21340755?refer=intelligentunit

DQN 从入门到放弃4 动态规划与Q-Learning
https://zhuanlan.zhihu.com/p/21378532?refer=intelligentunit

DQN从入门到放弃5 深度解读DQN算法
https://zhuanlan.zhihu.com/p/21421729?refer=intelligentunit

DQN从入门到放弃6 DQN的各种改进
https://zhuanlan.zhihu.com/p/21547911

DQN从入门到放弃7 连续控制DQN算法-NAF
https://zhuanlan.zhihu.com/p/21609472

MC
蒙特卡洛树搜索(MCTS)算法
https://blog.csdn.net/ljyt2/article/details/78332802
五子棋
https://zhuanlan.zhihu.com/p/32089487

posted @ 2018-07-18 15:58  傲衣华少  阅读(163)  评论(0编辑  收藏  举报