摘要:
地址: https://arxiv.org/pdf/1706.09529 作者提出了一种叫做Meta-Critic的框架,该框架可以用于强化学习、监督学习等算法中。该算法在强化学习中可以实现元强化学习中的元迁移强化学习算法。该算法框架具有很好的改进空间,因为这个其实并不是某个算法,而是一个框架,或者 阅读全文
posted @ 2024-06-05 19:07
Angry_Panda
阅读(83)
评论(0)
推荐(0)
浙公网安备 33010602011771号