摘要:        
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI Fall Symposia, (2015): 29-37 Abstract 深度RL已经为复杂的任务提供了精通的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环    阅读全文
        
            posted @ 2020-11-10 10:43
穷酸秀才大草包
阅读(554)
评论(0)
推荐(0)
        
     
                    
                     
                    
                 
                    
                
 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号