摘要: Policy Gradient 初始学习李宏毅讲的强化学习,听台湾的口音真是费了九牛二虎之力,后来看到有热心博客整理的很细致,于是转载来看,当作笔记留待复习用,原文链接在文末。看完笔记再去听一听李宏毅老师的视频,就可以听懂个大概了。当然了还有莫凡的强化学习更具实战性,听莫凡的课基本上可以带我们入门。 阅读全文
posted @ 2019-12-04 20:37 yg_staring 阅读(4401) 评论(0) 推荐(1) 编辑
摘要: 强化学习(Reinforcement Learning)简介 强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。 它主要包含四个元素,环 阅读全文
posted @ 2019-12-04 17:05 yg_staring 阅读(3269) 评论(0) 推荐(0) 编辑