摘要: 策略梯度 由于笔者对Actor-critic模型掌握的一直不是很好,导致最近一篇论文看的不是很明白,所以我决定好好复习一下强化学习里的Actor-critic算法,而复习Actor-critic算法,需要先从策略梯度开始,首先我们先介绍一下什么是策略梯度算法,之后我们再介绍一些实现技巧。 强化学习的 阅读全文
posted @ 2023-12-04 17:21 卡西西卡 阅读(44) 评论(0) 推荐(0)