摘要:
**发表时间:**2021(ICML 2021) **文章要点:**这篇文章提出了latent collocation method (LatCo)算法,用来planning状态序列,而不是动作序列,来解决long horizon的planning问题(it is easier to solve l 阅读全文
posted @ 2022-03-10 12:23
initial_h
阅读(95)
评论(0)
推荐(0)
摘要:
**发表时间:**2018(ICRA 2018) **文章要点:**这篇文章提出了一个叫model-based and model-free (Mb-Mf)的算法,先用model based的方法训一个policy,再用model free的方法来fine tune。具体的,先学一个model,然后 阅读全文
posted @ 2022-03-10 12:17
initial_h
阅读(198)
评论(0)
推荐(0)

浙公网安备 33010602011771号