摘要:        
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv:https://arxiv.org/abs/1812.05905 Abstract 无模型的深度RL算法已成功应用于一系列具有挑战性的序列决策和控制任务。但是,这些方法通常面临两个主要挑战:高样本复杂性和超参数的脆弱性。这两个    阅读全文
        
            posted @ 2020-11-02 19:07
穷酸秀才大草包
阅读(858)
评论(0)
推荐(0)
        
     
                    
                     
                    
                 
                    
                
 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号