会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
icuic
博客园
首页
新随笔
联系
管理
订阅
2025年4月30日
贝尔曼方程、贝尔曼期望方程和贝尔曼最优方程之间的区别与联系
摘要: 贝尔曼方程、贝尔曼期望方程和贝尔曼最优方程是强化学习中描述状态值函数或动作值函数的核心方程,它们在不同场景下有不同的形式和用途。 以下是它们的定义、区别和联系: 1. 贝尔曼方程(Bellman Equation) 定义: 贝尔曼方程是一个广义的概念,它描述了状态值函数 $ V(s) $ 或动作值函
阅读全文
posted @ 2025-04-30 20:12 icuic
阅读(693)
评论(0)
推荐(1)
公告