会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
伊犁纯流莱
博客园
首页
新随笔
联系
订阅
管理
2025年2月24日
Normalizing flow 流模型 | CS236深度生成模型Lec8学习笔记
摘要: CS236深度生成模型 Lec8的刷课总结/刷课笔记,内容是normalizing flow 流模型。
阅读全文
posted @ 2025-02-24 21:20 伊犁纯流莱
阅读(276)
评论(1)
推荐(1)
2025年1月14日
用于决策的世界模型 -- 论文 World Models (2018) & PlaNet (2019) 讲解
摘要: 介绍了两篇世界模型的文章 World Models (2018) 和 Learning Latent Dynamics for Planning from Pixels (2019),主要侧重点是世界模型在决策和规划中的应用。
阅读全文
posted @ 2025-01-14 14:38 伊犁纯流莱
阅读(1011)
评论(0)
推荐(4)
2025年1月8日
策略梯度AC算法 - CartPole环境, 使用RNN作为策略网络
摘要: 本文给出了使用RNN作为策略网络的AC算法代码示例,并在CartPole环境跑出结果。
阅读全文
posted @ 2025-01-08 14:46 伊犁纯流莱
阅读(78)
评论(0)
推荐(0)
2025年1月3日
变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)串讲
摘要:
主要介绍了变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)
阅读全文
posted @ 2025-01-03 23:09 伊犁纯流莱
阅读(732)
评论(0)
推荐(0)
2024年12月29日
RL中on-policy和off-policy的本质区别/重要性采样
摘要: 讨论了on-policy和off-policy的本质区别。说明了off-policy MC和off-policy TD是如何利用重要性采样的,以及为什么Q-learning不需要进行重要性采样。
阅读全文
posted @ 2024-12-29 20:35 伊犁纯流莱
阅读(143)
评论(0)
推荐(0)
2024年12月21日
概率图模型&机器学习 -- 精确推断方法 -- 变量消去(Variable Elimination)和信念传播(Belief Propagation)
摘要:
介绍变量消去和信念传播两种精确推断方法,其中信念传播中又分别介绍了sum-product和max-product.
阅读全文
posted @ 2024-12-21 14:46 伊犁纯流莱
阅读(300)
评论(0)
推荐(0)
公告