2018年11月13日

002-Q Leaning

摘要: 本学习笔记转自https://morvanzhou.github.io/ 什么是 Q Leaning 行为准则 我们做事情都会有一个自己的行为准则, 比如小时候爸妈常说”不写完作业就不准看电视”. 所以我们在 写作业的这种状态下, 好的行为就是继续写作业, 直到写完它, 我们还可以得到奖励, 不好的 阅读全文

posted @ 2018-11-13 13:34 医疗兵皮特儿 阅读(404) 评论(0) 推荐(0) 编辑

001-强化学习简介

摘要: 此系列笔记转自https://morvanzhou.github.io 强化学习并不会告诉你一个方向,也没有数据和标签,只会对结果进行评分(正确就会给高分,错误就会给低分),为了得到更高的分数,强化学习会记住使得自己获得高分的方法,从而获得最优解。 强化学习是机器学习大家族中的一大类, 使用强化学习 阅读全文

posted @ 2018-11-13 10:30 医疗兵皮特儿 阅读(414) 评论(0) 推荐(0) 编辑

导航