生成模型脉络

整理主要脉络

首先一个知识点：latent space，隐空间
两个作用；1. 压缩，得到的特征图相较原图更小；2. 提取出与目标高度相关的特征
VAE

出现的第一个生成式的基础模型，包括其后的GAN的generator也是同样的架构；
生成图像质量不佳；

GAN

最大的创新之处就是discriminator的加入，实现的“博弈过程”；
训练难度大，比如cycleGAN中G和D的loss就很难做到收敛；

Diffusion Model

一开始是text-image，后扩展至image-image；
加噪和去噪过程steps成百上千，每次都加/去小量的noise，导致计算量巨大；
2021年年底出了一篇加速计算的文章《High-Resolution Image Synthesis with Latent Diffusion Models》；

Diffusion GAN

可以加速diffusion采样
第二行的这个generate出来的image是通过加载预训练模型参数（pkl文件）从noise中生成出来的

总结

参考资料：
[1] From GANs to Stable Diffusion: The History, Hype, & Promise of Generative AI
[2] https://www.leewayhertz.com/how-to-train-a-diffusion-model/
[3] https://towardsai.net/p/machine-learning/diffusion-models-vs-gans-vs-vaes-comparison-of-deep-generative-models
[4] https://github.com/Zhendong-Wang/Diffusion-GAN

posted @ 2023-07-05 17:48 Elina-Chang 阅读(54) 评论(0) 收藏举报

刷新页面返回顶部