Fork me on GitHub

随笔分类 -  强化学习

摘要:一、前述 本文通过一个案例来讲解Q-Learning 二、具体 1、案例 假设我们需要走到5房间。 转变为如下图:先构造奖励,达到5,即能够走得5的action则说明奖励比较高设置成100,没有达到5说明奖励比较低,设置成0。 Q-learning实现步骤: 2、案例详解: 第一步的Q(1,5):最 阅读全文
posted @ 2018-06-30 23:09 L先生AI课堂 阅读(4985) 评论(1) 推荐(0)
摘要:一、前述 强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。 通俗点说:学习系统没有像很多其它形式的机器学习方法一样被告知应该做出什么行为,必 阅读全文
posted @ 2018-06-30 16:46 L先生AI课堂 阅读(902) 评论(0) 推荐(0)