2020年6月24日

强化学习7日打卡营-世界冠军带你从零实践--基于表格型方法的 RL

摘要: 强化学习 Reinforce Learning 强化学习区别于机器学习的一点是,强化学习是来做决策的。根据环境的反馈,做出决策。 外界环境情况复杂,和环境的交互主要有 环境的状态 stat、智能体的动作、和对动作带来收益的评价 reward。 这里面涉及2个对象,agent 和 env。 agent 阅读全文

posted @ 2020-06-24 18:15 parkin 阅读(158) 评论(0) 推荐(0) 编辑

导航