随笔分类 -  强化学习

004-DQN
摘要:什么是 DQN 今天我们会来说说强化学习中的一种强大武器, Deep Q Network 简称为 DQN. Google Deep mind 团队就是靠着这 DQN 使计算机玩电动玩得比我们还厉害. 强化学习与神经网络 之前我们所谈论到的强化学习方法都是比较传统的方式, 而如今, 随着机器学习在日常 阅读全文

posted @ 2018-11-17 12:39 医疗兵皮特儿 阅读(691) 评论(0) 推荐(0)

003-sarsa
摘要:本学习笔记转自https://morvanzhou.github.io/ 什么是 Sarsa 今天我们会来说说强化学习中一个和 Q learning 类似的算法, 叫做 Sarsa. 注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章. 在强化学习中 Sarsa 和 Q le 阅读全文

posted @ 2018-11-14 23:17 医疗兵皮特儿 阅读(436) 评论(0) 推荐(0)

002-Q Leaning
摘要:本学习笔记转自https://morvanzhou.github.io/ 什么是 Q Leaning 行为准则 我们做事情都会有一个自己的行为准则, 比如小时候爸妈常说”不写完作业就不准看电视”. 所以我们在 写作业的这种状态下, 好的行为就是继续写作业, 直到写完它, 我们还可以得到奖励, 不好的 阅读全文

posted @ 2018-11-13 13:34 医疗兵皮特儿 阅读(439) 评论(0) 推荐(0)

001-强化学习简介
摘要:此系列笔记转自https://morvanzhou.github.io 强化学习并不会告诉你一个方向,也没有数据和标签,只会对结果进行评分(正确就会给高分,错误就会给低分),为了得到更高的分数,强化学习会记住使得自己获得高分的方法,从而获得最优解。 强化学习是机器学习大家族中的一大类, 使用强化学习 阅读全文

posted @ 2018-11-13 10:30 医疗兵皮特儿 阅读(428) 评论(0) 推荐(0)

导航