摘要:        
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! https://arxiv.org/abs/1908.04683 Abstract 深度强化学习(DRL)的一致性和可重复性评估并不简单。在街机学习环境(ALE)中,环境参数(如随机性或最大允许游戏时间)的微小变化会导致非常不同的性能。在    阅读全文
        
            posted @ 2023-01-14 19:48
穷酸秀才大草包
阅读(64)
评论(0)
推荐(0)
        
    上海交通大学CS博士生