推荐排行榜 - 凯鲁嘎吉 - 博客园

推荐排行榜

Meta-RL——Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables 凯鲁嘎吉 2021-11-23 13:04 阅读:1251 评论:10 推荐:2

多元/多维高斯/正态分布概率密度函数推导 (Derivation of the Multivariate/Multidimensional Normal/Gaussian Density) 凯鲁嘎吉 2021-11-12 08:45 阅读:15917 评论:0 推荐:2

重要性采样(Importance Sampling)——TRPO与PPO的补充凯鲁嘎吉 2021-10-13 11:32 阅读:2560 评论:0 推荐:2

信赖域策略优化(Trust Region Policy Optimization, TRPO) 凯鲁嘎吉 2021-10-10 13:31 阅读:3466 评论:1 推荐:2

一类涉及矩阵范数的优化问题凯鲁嘎吉 2021-04-03 10:14 阅读:5149 评论:1 推荐:2