如何计算两个正太分布的KL散度 —— 正太分布的KL散度 (Kullback-Leibler divergence) 计算
参考:
https://blog.csdn.net/int_main_Roland/article/details/124650909

给出实现代码:
def get_kl():
mean0, log_std0, std0 = policy_net(Variable(states))
mean1 = Variable(mean0.data)
log_std1 = Variable(log_std0.data)
std1 = Variable(std0.data)
kl = log_std1 - log_std0 + (std0.pow(2) + (mean0 - mean1).pow(2)) / (2.0 * std1.pow(2)) - 0.5
return kl.sum(1, keepdim=True)
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2024-02-26 21:55 Angry_Panda 阅读(124) 评论(0) 收藏 举报
浙公网安备 33010602011771号