会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
小染子
博客园
首页
新随笔
联系
订阅
管理
2023年2月25日
动手学强化学习 第二章 多臂tiger机问题 阅读笔记
摘要: 第二章 多臂tiger机问题 第一节 简介 强化学习是一种试错型学习范式。 第二节 问题介绍 多臂tiger机(multi-armed bandit,MAB)不存在状态信息,只有动作和奖励。有一个拥有K根拉杆的tiger机,拉动每一根拉杆都对应一个关于奖励的概率分布R。我们每次拉动其中一根拉杆,就可
阅读全文
posted @ 2023-02-25 09:25 小染子
阅读(166)
评论(0)
推荐(0)