会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
兀凯奇
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
算法
用来记录算法练习的过程
动态规划
摘要:在学习强化学习的过程中,涉及了利用动态规划的思想对MDP进行训练,所以积累一些动态规划的算法知识 算法理论的内容研读了知乎上这的这个回答:动态规划理论 在他举得例子中:假设您是个土豪,身上带了足够的1、5、10、20、50、100元面值的钞票。现在您的目标是凑出某个金额w,需要用到尽量少的钞票。 依
阅读全文
posted @
2020-10-11 17:19
兀凯奇
阅读(170)
评论(0)
推荐(0)
公告