【读书笔记】2_增强学习中的Q-Learning

摘要: 本文为Thomas Simonini增强学习系列文章笔记或读后感,原文可以直接跳转到medium系列文章。主要概念为:Q-Learning,探讨其概念以及用Numpy实现我们可以将二维游戏想象成平面格子,每个格子代表一个状态,并且对应了不同的动作,例如下图:Q函数接收状态和动作两个参数并输出Q值,即在一个状态下各种动作各自未来的期望奖励。公式如下:这里的未来期望奖励,就是当前状态下一直到结束状态(... 阅读全文
posted @ 2018-09-14 23:54 BPassionate 阅读(408) 评论(0) 推荐(0)

【读书笔记】1_增强学习介绍

摘要: 本文为Thomas Simonini增强学习系列文章笔记或读后感,原文可以直接跳转到medium系列文章。文章先是给用户指出必须了解增强学习的概念增强学些是什么?为什么奖励是中心概念增强学习的任务和三种实现方式深度增强学习的深(deep)意味着什么?增强学习过程概念介绍首先,什么是增强学习? 我们需要用计算机进行模拟一个环境,例如玩马里奥游戏,来理解这个过程。由于不是我们自己玩,需要一个代练(Ag... 阅读全文
posted @ 2018-09-14 14:21 BPassionate 阅读(342) 评论(0) 推荐(0)

先立一个书单【flag】,敦促自己温故知新

摘要: 书单来源david mimno副教授给ML新生的建议博文,外加一部分搜罗的书籍 学习方式:以书籍查看,习题为辅,代码为最终实现方式,分主题进行今年的学习笔记,立此旗为证。 线代 --> 概率统计 -> 机器学习主题 不断更新下列书籍的学习资源以及课程等。 机器学习方面的书籍 线性代数和概率统计 阅读全文
posted @ 2018-03-02 14:07 BPassionate 阅读(125) 评论(0) 推荐(0)