Is Deep Reinforcement Learning Really Superhuman on Atari? Leveling the playing field
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! https://arxiv.org/abs/1908.04683 Abstract 深度强化学习(DRL)的一致性和可重复性评估并不简单。在街机学习环境(ALE)中,环境参数(如随机性或最大允许游戏时间)的微小变化会导致非常不同的性能。在
阅读全文
posted @ 2023-01-14 19:48