会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
乖张❤
博客园
首页
新随笔
联系
订阅
管理
2021年7月21日
P1 基本概念
摘要: 最近在跟B站视频 https://www.bilibili.com/video/BV1rv41167yx 学习深度强化学习 然后做了些简单的笔记 ###基本概念 强化学习两种随机性来源: 动作 状态转移 轨迹:包含 状态、动作、奖励 三个参数 Rewards and Returns Return:回
阅读全文
posted @ 2021-07-21 23:10 乖张❤
阅读(631)
评论(0)
推荐(0)
公告