摘要: **发表时间:**2021(ICML 2021) **文章要点:**文章想说,我们训好一个policy之后,在真正用他的时候需要考虑安全性和可靠性(RL tasks is the safety and reliability of the system)。所以我们就需要一个方法来快速检测这个trai 阅读全文
posted @ 2021-10-02 12:02 initial_h 阅读(105) 评论(0) 推荐(0)