摘要:        
**发表时间:**2019(ICLR 2019) **文章要点:**这篇文章主要从理论上分析了model based RL的lower bound,然后不断最大化这个lower bound,从而证明了理论上可以单调上升。 这个框架还提出了一个optimism-in-face-of-uncertain    阅读全文
posted @ 2022-02-05 12:08
initial_h
阅读(144)
评论(0)
推荐(0)
			
			
			
			
摘要:        
**发表时间:**2018(NIPS 2018) **文章要点:**这篇文章提出了一个model based 方法probabilistic ensembles with trajectory sampling (PETS),达到了model free方法的performance。主要思路是通过概率    阅读全文
posted @ 2022-02-05 12:02
initial_h
阅读(375)
评论(0)
推荐(0)
			
 
                    
                
 浙公网安备 33010602011771号
浙公网安备 33010602011771号