强化学习 - 随笔分类 - 医疗兵皮特儿

004-DQN

摘要：什么是 DQN 今天我们会来说说强化学习中的一种强大武器, Deep Q Network 简称为 DQN. Google Deep mind 团队就是靠着这 DQN 使计算机玩电动玩得比我们还厉害. 强化学习与神经网络之前我们所谈论到的强化学习方法都是比较传统的方式, 而如今, 随着机器学习在日常阅读全文

posted @ 2018-11-17 12:39 医疗兵皮特儿阅读(715) 评论(0) 推荐(0)

003-sarsa

摘要：本学习笔记转自https://morvanzhou.github.io/ 什么是 Sarsa 今天我们会来说说强化学习中一个和 Q learning 类似的算法, 叫做 Sarsa. 注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章. 在强化学习中 Sarsa 和 Q le 阅读全文

posted @ 2018-11-14 23:17 医疗兵皮特儿阅读(455) 评论(0) 推荐(0)

002-Q Leaning

摘要：本学习笔记转自https://morvanzhou.github.io/ 什么是 Q Leaning 行为准则我们做事情都会有一个自己的行为准则, 比如小时候爸妈常说”不写完作业就不准看电视”. 所以我们在写作业的这种状态下, 好的行为就是继续写作业, 直到写完它, 我们还可以得到奖励, 不好的阅读全文

posted @ 2018-11-13 13:34 医疗兵皮特儿阅读(452) 评论(0) 推荐(0)

001-强化学习简介

摘要：此系列笔记转自https://morvanzhou.github.io 强化学习并不会告诉你一个方向，也没有数据和标签，只会对结果进行评分（正确就会给高分，错误就会给低分），为了得到更高的分数，强化学习会记住使得自己获得高分的方法，从而获得最优解。强化学习是机器学习大家族中的一大类, 使用强化学习阅读全文

posted @ 2018-11-13 10:30 医疗兵皮特儿阅读(448) 评论(0) 推荐(0)

随笔分类 - 强化学习

004-DQN

003-sarsa

002-Q Leaning

001-强化学习简介

导航

公告