05 2017 档案
摘要:Q-learning 相关的资料 https://www.youtube.com/watch?v=V1eYniJ0Rnk google deepmind 的Q-learning 算法打游戏的一个很酷的视频。请观看 1.http://www.pysnap.com/reinforcement-learn
阅读全文
摘要://Q-learning 源码分析。 import java.util.Random; public class QLearning1 { private static final int Q_SIZE = 6; private static final double GAMMA = 0.8; pr
阅读全文
摘要:在阅读了Q-learning 算法学习-1文章之后。 我分析了这个算法的本质。 算法本质个人分析。 1.算法的初始状态是随机的,所以每个初始状态都是随机的,所以每个初始状态出现的概率都一样的。如果训练的数量够多的 话,就每种路径都会走过。所以起始的Q(X,Y) 肯定是从目标的周围开始分散开来。也就是
阅读全文
摘要:
阅读全文
摘要:/usr/include/c++/4.8/functional:1697:61: error: no type named ‘type’ in ‘class std::result_of<std::_Mem_fn<void 看的上面的错误。 之后Google 了,结合下面两个链接才解决。 https
阅读全文

浙公网安备 33010602011771号