摘要:        
**发表时间:**2021 **文章要点:**这篇文章提出了Discriminator Augmented MBRL (DAM)算法,文章想说model based RL里面,学到的model是不准确的,这个问题也是很难避免的,于是作者换了一个思路,不去修正model,而是通过importance     阅读全文
posted @ 2022-03-31 09:08
initial_h
阅读(62)
评论(0)
推荐(0)
			
			
			
			
摘要:        
**发表时间:**2021 **文章要点:**文章基于TF-Agent库(model free RL)设计了一个model based RL的库,主要包括三个模块,Environment Model,Agent Classes和Experiment Harness。Environment Model    阅读全文
posted @ 2022-03-31 09:05
initial_h
阅读(52)
评论(0)
推荐(0)
			
 
                    
                     
                    
                 
                    
                
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号