05 2017 档案

摘要:Q-learning 相关的资料 https://www.youtube.com/watch?v=V1eYniJ0Rnk google deepmind 的Q-learning 算法打游戏的一个很酷的视频。请观看 1.http://www.pysnap.com/reinforcement-learn 阅读全文
posted @ 2017-05-04 23:06 AI-LEARNER 阅读(204) 评论(0) 推荐(0)
摘要://Q-learning 源码分析。 import java.util.Random; public class QLearning1 { private static final int Q_SIZE = 6; private static final double GAMMA = 0.8; pr 阅读全文
posted @ 2017-05-04 23:05 AI-LEARNER 阅读(370) 评论(0) 推荐(0)
摘要:在阅读了Q-learning 算法学习-1文章之后。 我分析了这个算法的本质。 算法本质个人分析。 1.算法的初始状态是随机的,所以每个初始状态都是随机的,所以每个初始状态出现的概率都一样的。如果训练的数量够多的 话,就每种路径都会走过。所以起始的Q(X,Y) 肯定是从目标的周围开始分散开来。也就是 阅读全文
posted @ 2017-05-04 23:04 AI-LEARNER 阅读(201) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-05-04 23:03 AI-LEARNER 阅读(171) 评论(0) 推荐(0)
摘要:/usr/include/c++/4.8/functional:1697:61: error: no type named ‘type’ in ‘class std::result_of<std::_Mem_fn<void 看的上面的错误。 之后Google 了,结合下面两个链接才解决。 https 阅读全文
posted @ 2017-05-03 16:31 AI-LEARNER 阅读(3580) 评论(0) 推荐(0)