随笔分类 -  深度学习

摘要:Summary 目录Summary标准序列推荐模型其他推荐模型FPMCDNN(Pooling)GRU4Rec(RNN-based)GRU4Rec+(RNN-based)Caser(CNN-based)SASRec(Transformer-based)DIN(Transformer-based)BER 阅读全文
posted @ 2024-11-10 20:31 Brain404 阅读(819) 评论(0) 推荐(0)
摘要:【神经网络组件】Transformer Encoder 目录【神经网络组件】Transformer Encoder1. seq2seq模型2. 为什么只需要Transformer Encoder3. Transformer Encoder的结构 1. seq2seq模型 什么是sequence:se 阅读全文
posted @ 2024-11-10 20:23 Brain404 阅读(251) 评论(0) 推荐(0)
摘要:目录1. 引入self-attention2. self-attention3. self-attention的并行计算4. 多头self-attention5. 位置编码,self-attention的扩展知识 attention层最早由Google提出,用在了Transformer中。如今,at 阅读全文
posted @ 2024-10-28 21:25 Brain404 阅读(395) 评论(0) 推荐(0)
摘要:推理过程也叫采样过程,是从噪音\(\mathbf{x}_T\)中逐步去噪,最终生成图片的过程 文章内容主要参考了李宏毅老师的课程 目录1. 扩散模型的推理过程推理过程第1步推理过程第3步推理过程第4步2. 总结 1. 扩散模型的推理过程 在论文中,扩散模型的推理过程如下 推理过程第1步 生成噪音\( 阅读全文
posted @ 2024-10-19 11:40 Brain404 阅读(734) 评论(1) 推荐(0)
摘要:高能预警:这篇文章难度很大,包含很多的数学推导,如果不想接触太多的数学内容,那么可以跳过不看。 看这篇文章之前,你需要了解:什么是马尔科夫链,什么是极大似然估计,什么是KL散度,两个正态分布的KL散度,什么是贝叶斯公式 以下内容参考了主要参考了博客What are Diffusion Models? 阅读全文
posted @ 2024-10-19 11:13 Brain404 阅读(782) 评论(0) 推荐(0)
摘要:扩散模型的训练过程 阅读全文
posted @ 2024-10-17 12:09 Brain404 阅读(2871) 评论(0) 推荐(0)
摘要:生成图片的过程,很像艺术家雕刻雕像的过程。 艺术家从一块石头开始,逐渐的雕刻出优美的雕像。 同样的,扩散模型从全是噪音的图片开始,逐步降噪,最终生成想要的图片。 阅读全文
posted @ 2024-10-16 21:06 Brain404 阅读(373) 评论(0) 推荐(0)