增强学习--TRPO算法

理论部分参考

推导

数学上的分析

代码

posted @ 2019-05-24 18:00  阿夏z  阅读(818)  评论(0)    收藏  举报