会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
小花技术大本营
博客园
首页
新随笔
联系
订阅
管理
2020年3月12日
(十三)从零开始学人工智能-强化学习:值函数近似和策略梯度
摘要: 强化学习 值函数近似和策略梯度 [toc] 前两节内容都是强化学习的一些基础理论 ,只能解决一些中小规模的问题,实际情况下很多价值函数需要一张大表来存储,获取某一状态或动作价值的时候通常需要一个查表操作,这对于某些状态或动作空间很大的问题几乎无法求解,而许多实际问题拥有大量状态或动作,甚至是连续的状
阅读全文
posted @ 2020-03-12 08:57 小花技术大本营
阅读(2117)
评论(0)
推荐(0)
公告