摘要:emm,花了一周时间完成了DQN的从入门到入土,这个系列是完完全全的入门系列,因为讲的内容很简单,内容也比较少,仅仅是一个最基本的介绍。 我也是因为偶然的原因才接触到强化学习,然后觉得很有意思,比较好奇它是怎么做到的,于是就花了一段时间去了解,接着就将自己的入门过程就写下来了。 这个系列相比较与数据 阅读全文
posted @ 2020-05-31 23:10 段小辉 阅读(16) 评论(0) 推荐(0) 编辑
摘要:在DQN(Deep Q-learning)入门教程(四)之Q-learning Play Flappy Bird中,我们使用q-learning算法去对Flappy Bird进行强化学习,而在这篇博客中我们将使用神经网络模型来代替Q-table,关于DQN的介绍,可以参考我前一篇博客:DQN(Dee 阅读全文
posted @ 2020-05-31 22:16 段小辉 阅读(73) 评论(0) 推荐(0) 编辑
摘要:简介 DQN——Deep Q-learning。在上一篇博客DQN(Deep Q-learning)入门教程(四)之Q-learning Play Flappy Bird 中,我们使用Q-Table来储存state与action之间的q值,那么这样有什么不足呢?我们可以将问题的稍微复杂化一点了,如果 阅读全文
posted @ 2020-05-30 17:04 段小辉 阅读(25) 评论(0) 推荐(0) 编辑
摘要:在上一篇博客中,我们详细的对Q-learning的算法流程进行了介绍。同时我们使用了$\epsilon-贪婪法$防止陷入局部最优。 那么我们可以想一下,最后我们得到的结果是什么样的呢?因为我们考虑到了所有的($\epsilon-贪婪法$导致的)情况,因此最终我们将会得到一张如下的Q-Table表。 阅读全文
posted @ 2020-05-30 01:51 段小辉 阅读(78) 评论(0) 推荐(0) 编辑
摘要:蒙特卡罗法 在介绍Q-learing算法之前,我们还是对蒙特卡罗法(MC)进行一些介绍。MC方法是一种无模型(model-free)的强化学习方法,目标是得到最优的行为价值函数$q_*$。在前面一篇博客中,我们所介绍的动态规划算法则是一种有模型的算法。那么问题来了,什么是模型(model)?模型其实 阅读全文
posted @ 2020-05-28 02:37 段小辉 阅读(112) 评论(0) 推荐(0) 编辑
摘要:在上一篇博客:DQN(Deep Q-learning)入门教程(一)之强化学习介绍中有三个很重要的函数: 策略:\(\pi(a|s) = P(A_t=a | S_t=s)\) 状态价值函数:\(v_\pi(s)=\mathbb{E}\left[R_{t+1}+\gamma \left(S_{t+1} 阅读全文
posted @ 2020-05-27 15:21 段小辉 阅读(87) 评论(0) 推荐(1) 编辑
摘要:什么是强化学习? 强化学习(Reinforcement learning,简称RL)是和监督学习,非监督学习并列的第三种机器学习方法,如下图示: 首先让我们举一个小时候的例子: 你现在在家,有两个动作选择:打游戏和读书。如果选择打游戏的话,你就跑到了网吧,选择读书的话,就坐在了书桌面前。你爸妈下班回 阅读全文
posted @ 2020-05-24 11:25 段小辉 阅读(102) 评论(0) 推荐(0) 编辑
摘要:简介 DQN入门系列地址: "https://www.cnblogs.com/xiaohuiduan/category/1770037.html" 本来呢,在上一个系列 "数据挖掘入门系列" 博客中,我是准备写数据挖掘的教程,然后不知怎么滴,博客越写越偏,写到了神经网络,深度学习去了。在我写完数据挖 阅读全文
posted @ 2020-05-23 23:32 段小辉 阅读(95) 评论(0) 推荐(0) 编辑
摘要:从无到有,陆陆续续一个 数据挖掘入门系列 的教程就写了18篇博客了,这个是我没有想到的,本来以为可能写10篇博客就结束了,但是写着写着写着写着就写了这么多: 1. "数据挖掘入门系列教程(一)之亲和性分析" 2. "数据挖掘入门系列教程(二)之分类问题OneR算法" 3. "数据挖掘入门系列教程(三 阅读全文
posted @ 2020-05-12 16:38 段小辉 阅读(41) 评论(0) 推荐(1) 编辑
摘要:简介 在上一篇博客: "数据挖掘入门系列教程(十一点五)之CNN网络介绍" 中,介绍了CNN的工作原理和工作流程,在这一篇博客,将具体的使用代码来说明如何使用keras构建一个CNN网络来对CIFAR 10数据集进行训练。 如果对keras不是很熟悉的话,可以去看一看 "官方文档" 。或者看一看我前 阅读全文
posted @ 2020-05-01 14:10 段小辉 阅读(141) 评论(2) 推荐(1) 编辑