目录
这个概念讲的不错
VAE+Classifier 入门例子
这个概念讲的不错
为什么vae效果不好,但vae+diffusion效果就好了?
综上,可以理解为VQ-VAE或者是VQ-GAN都提供了一个有效的图片表征方法,即通过一个压缩后的latent feature就能够在RGB空间上对应一张图。扩散模型中,DDPM已经证明了通过大量的算力资源训练一个diffusion model能够在RGB空间把图像分布拟合好,Stable Diffusion的思路则是“既然通过一个压缩后的latent feature能够表征好一张图,那就索性在latent feature的隐空间上做扩散”,因此Stable Diffusion本质上是一个latent diffusion model。
VAE+Classifier 入门例子
https://zhuanlan.zhihu.com/p/492693584