摘要: 最近在跟B站视频 https://www.bilibili.com/video/BV1rv41167yx 学习深度强化学习 然后做了些简单的笔记 ###基本概念 强化学习两种随机性来源: 动作 状态转移 轨迹:包含 状态、动作、奖励 三个参数 Rewards and Returns Return:回 阅读全文
posted @ 2021-07-21 23:10 乖张❤ 阅读(631) 评论(0) 推荐(0)