会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
AikNr
噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜
博客园
首页
新随笔
联系
订阅
管理
2025年10月11日
GAE-广义优势估计算法介绍
摘要: GAE 的具体计算方式 GAE 是一种在强化学习中用于估计优势函数的高级技巧,它通过一个参数 λ 来巧妙地平衡偏差 (bias) 和方差 (variance),从而得到更稳定和高效的策略更新。 1. 目标:估计优势函数 (Advantage Function) 首先,我们想估计的目标是优势函数 \(
阅读全文
posted @ 2025-10-11 00:50 AikNr
阅读(365)
评论(0)
推荐(0)
公告