增强学习--TRPO算法

理论部分参考

推导

数学上的分析

代码

posted @ 2019-05-24 18:00  阿夏z  阅读(793)  评论(0编辑  收藏  举报