摘要:
注意: 本文并不讲REINFORCE算法,而是讲强化学习的交叉熵算法,关于REINFORCE算法可以参看: https://www.cnblogs.com/devilmaycry812839668/p/15889282.html 强化学习有多种分类方法,其中一类分法为: 基于值函数的。该种类型的强化 阅读全文
posted @ 2022-09-24 15:04
Angry_Panda
阅读(209)
评论(0)
推荐(0)
浙公网安备 33010602011771号