随笔分类 -  算法

用来记录算法练习的过程
摘要:在学习强化学习的过程中,涉及了利用动态规划的思想对MDP进行训练,所以积累一些动态规划的算法知识 算法理论的内容研读了知乎上这的这个回答:动态规划理论 在他举得例子中:假设您是个土豪,身上带了足够的1、5、10、20、50、100元面值的钞票。现在您的目标是凑出某个金额w,需要用到尽量少的钞票。 依 阅读全文
posted @ 2020-10-11 17:19 兀凯奇 阅读(170) 评论(0) 推荐(0)