摘要:
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI 2019 Best Paper Abstract RL中大量使用了有限视野的前瞻策略,并显示出令人印象深刻的经验性成功。通常,前瞻策略是通过特定的规划方法(例如,蒙特卡洛树搜索)(例如,在AlphaZero中(Silver et 阅读全文
摘要:
仅讨论部分RL仿真平台,下图参见AI2-THOR论文中的图: ALE是一个开源的Atari 2600模拟器。 TORCS:《The Open Racing Car Simulator》(TORCS) 是一款开源3D赛车模拟游戏。是在Linux操作系统上广受欢迎的赛车游戏。有50种车辆和20条赛道,简 阅读全文