摘要:        
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ICLR 2020 ABSTRACT 本文介绍了Meta-Q-Learning (MQL),这是一种用于元强化学习(meta-RL)的新的异策算法。MQL基于三个简单的想法。首先,我们表明,如果可以访问表示过去轨迹的上下文变量,则Q学习将    阅读全文
        
            posted @ 2020-09-08 23:04
穷酸秀才大草包
阅读(849)
评论(0)
推荐(0)
        
     
                     
                    
                 
                    
                
 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号