上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 269 下一页

2024年12月22日

摘要: 网上找到的一个实现: 地址: https://gist.github.com/HenryJia/23db12d61546054aa43f8dc587d9dc2c 稍微修改后的代码: import numpy as np import gym def sigmoid(x): return 1.0 / 阅读全文
posted @ 2024-12-22 21:36 Angry_Panda 阅读(439) 评论(0) 推荐(0)
摘要: 原文地址: http://deeprl.neurondance.com/d/154 美国 Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154) 伯克利:Sergey Levine(论文高产作者)、Pieter Abbel 阅读全文
posted @ 2024-12-22 19:41 Angry_Panda 阅读(345) 评论(0) 推荐(0)
摘要: SQL算法的官方实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 提两个问题: SQL算法的原始论文中在计算Q loss function的时候建议使用重要性采样,而实际代码中却使用的是均匀采样,同时也没有采样重要性采样的 阅读全文
posted @ 2024-12-22 14:22 Angry_Panda 阅读(46) 评论(0) 推荐(0)
摘要: 代码实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning/src/branch/master/softlearning/misc/kernel.py SVGD 是一种高效、灵活的推断方法,尤其适合高维度复杂分布的近似问题。 f 阅读全文
posted @ 2024-12-22 13:28 Angry_Panda 阅读(57) 评论(0) 推荐(0)

2024年12月21日

摘要: 前文: 强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector) 前文说到概率分布的仿射变换(Bijector)在贝叶斯、变分推断等领域有很重要的作用,但是在强化学习中呢,其实在强化学习中也会用到,但是最为普遍的应用场景其实只是做简单的tanh变换。 在强化学习 阅读全文
posted @ 2024-12-21 18:19 Angry_Panda 阅读(108) 评论(0) 推荐(0)
摘要: 关于TensorFlow的probability模块的教程: https://tensorflow.google.cn/probability/examples/A_Tour_of_TensorFlow_Probability?hl=zh-cn 相关: https://colab.research. 阅读全文
posted @ 2024-12-21 16:19 Angry_Panda 阅读(149) 评论(0) 推荐(0)
摘要: 相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9588328155434867865"}&n_type=-1&p_from=-1 阅读全文
posted @ 2024-12-21 10:31 Angry_Panda 阅读(34) 评论(0) 推荐(0)

2024年12月20日

摘要: 高斯分布微分熵的推导 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/raby_gyl/article/details/73477043 阅读全文
posted @ 2024-12-20 23:04 Angry_Panda 阅读(217) 评论(0) 推荐(0)

2024年12月19日

摘要: 视频地址: https://www.bilibili.com/video/BV13qBNYqExW/ 【完整演讲视频】OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲,并表示:「我们获得的数据已经到头,不会再有更多了。」 自然界中,体质量和大脑质 阅读全文
posted @ 2024-12-19 12:09 Angry_Panda 阅读(35) 评论(0) 推荐(0)

2024年12月18日

摘要: 相关视频: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a7c33851d2f0a4e69aa50fae3038d63-sd.mp4 阅读全文
posted @ 2024-12-18 17:09 Angry_Panda 阅读(65) 评论(0) 推荐(0)
上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 269 下一页

导航