会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wuhaof12
博客园
首页
新随笔
联系
订阅
管理
2023年12月4日
策略梯度笔记
摘要: 策略梯度 由于笔者对Actor-critic模型掌握的一直不是很好,导致最近一篇论文看的不是很明白,所以我决定好好复习一下强化学习里的Actor-critic算法,而复习Actor-critic算法,需要先从策略梯度开始,首先我们先介绍一下什么是策略梯度算法,之后我们再介绍一些实现技巧。 强化学习的
阅读全文
posted @ 2023-12-04 17:21 卡西西卡
阅读(44)
评论(0)
推荐(0)
公告