2020年11月10日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI Fall Symposia, (2015): 29-37 Abstract 深度RL已经为复杂的任务提供了精通的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环 阅读全文
posted @ 2020-11-10 10:43 穷酸秀才大草包 阅读(554) 评论(0) 推荐(0)

导航