摘要:        
**发表时间:**2021(ICML 2021) **文章要点:**这篇文章提出了latent collocation method (LatCo)算法,用来planning状态序列,而不是动作序列,来解决long horizon的planning问题(it is easier to solve l    阅读全文
posted @ 2022-03-10 12:23
initial_h
阅读(91)
评论(0)
推荐(0)
			
			
			
			
摘要:        
**发表时间:**2018(ICRA 2018) **文章要点:**这篇文章提出了一个叫model-based and model-free (Mb-Mf)的算法,先用model based的方法训一个policy,再用model free的方法来fine tune。具体的,先学一个model,然后    阅读全文
posted @ 2022-03-10 12:17
initial_h
阅读(191)
评论(0)
推荐(0)
			
 
                    
                     
                    
                 
                    
                
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号