随笔分类 - 深度学习
摘要:Summary 目录Summary标准序列推荐模型其他推荐模型FPMCDNN(Pooling)GRU4Rec(RNN-based)GRU4Rec+(RNN-based)Caser(CNN-based)SASRec(Transformer-based)DIN(Transformer-based)BER
阅读全文
摘要:【神经网络组件】Transformer Encoder 目录【神经网络组件】Transformer Encoder1. seq2seq模型2. 为什么只需要Transformer Encoder3. Transformer Encoder的结构 1. seq2seq模型 什么是sequence:se
阅读全文
摘要:目录1. 引入self-attention2. self-attention3. self-attention的并行计算4. 多头self-attention5. 位置编码,self-attention的扩展知识 attention层最早由Google提出,用在了Transformer中。如今,at
阅读全文
摘要:推理过程也叫采样过程,是从噪音\(\mathbf{x}_T\)中逐步去噪,最终生成图片的过程 文章内容主要参考了李宏毅老师的课程 目录1. 扩散模型的推理过程推理过程第1步推理过程第3步推理过程第4步2. 总结 1. 扩散模型的推理过程 在论文中,扩散模型的推理过程如下 推理过程第1步 生成噪音\(
阅读全文
摘要:高能预警:这篇文章难度很大,包含很多的数学推导,如果不想接触太多的数学内容,那么可以跳过不看。 看这篇文章之前,你需要了解:什么是马尔科夫链,什么是极大似然估计,什么是KL散度,两个正态分布的KL散度,什么是贝叶斯公式 以下内容参考了主要参考了博客What are Diffusion Models?
阅读全文
摘要:扩散模型的训练过程
阅读全文
摘要:生成图片的过程,很像艺术家雕刻雕像的过程。
艺术家从一块石头开始,逐渐的雕刻出优美的雕像。
同样的,扩散模型从全是噪音的图片开始,逐步降噪,最终生成想要的图片。
阅读全文