TaeYoon

2018年11月20日

David Silver RL课程第2课（Markov decision processes)

摘要： 1.Markov decision processes formally describe an environment for reinforcement learning Where the environment is fully observable The current state co 阅读全文

posted @ 2018-11-20 17:01 TaeYoon 阅读(248) 评论(0) 推荐(0)

David Silver RL课程第1课（关于增强学习的介绍）

摘要： 1.The difference of the reinforcement learning:(区别于传统的监督/非监督学习） no supervisor ,only a reward signal（小孩试错的过程） feedback is delayed,not instantaneous(错误的阅读全文

posted @ 2018-11-20 16:59 TaeYoon 阅读(345) 评论(0) 推荐(0)

公告