随笔分类 - 强化学习

【强化学习篇】--强化学习案例详解一

摘要：一、前述本文通过一个案例来讲解Q-Learning 二、具体 1、案例假设我们需要走到5房间。转变为如下图：先构造奖励，达到5，即能够走得5的action则说明奖励比较高设置成100，没有达到5说明奖励比较低，设置成0。 Q-learning实现步骤： 2、案例详解：第一步的Q(1,5)：最阅读全文

posted @ 2018-06-30 23:09 L先生AI课堂阅读(5087) 评论(1) 推荐(0)

【强化学习篇】--强化学习从初识到应用

摘要：一、前述强化学习是学习一个最优策略(policy)，可以让本体(agent)在特定环境(environment)中，根据当前的状态(state)，做出行动(action)，从而获得最大回报(G or return)。通俗点说：学习系统没有像很多其它形式的机器学习方法一样被告知应该做出什么行为，必阅读全文

posted @ 2018-06-30 16:46 L先生AI课堂阅读(917) 评论(0) 推荐(0)

L先生AI课堂

联想集团算法工程师一枚！ Get busy living, or get busy dying!!

随笔分类 - 强化学习

公告