您的位置：首页 > 健康 > 养生 > 深入了解diffusion model

深入了解diffusion model

2025/4/21 18:01:15 来源：https://blog.csdn.net/El_ia_uk/article/details/139357526 浏览: 次关键词：深入了解diffusion model

diffusion model是如何运作的

会输入当时noise的严重程度，根据我们的输入来确定在第几个step，并做出不同的回应。

Denoise模组内部实际做的事情

产生一张图片和产生noise难度是不一样的，若denoise 模块产生一只带噪声的猫说明这个模块已经会画一只猫，所以产生一只带噪声的猫和产生图片中死亡噪声难度是不一样的

如何训练noise predictor

输入这张图片和step id 然后产生出一个预测中的噪声，但为了产生预测中的噪声，则需要输入这张图片的噪声是什么样子，才会学习如何把噪声输出。

noise predictor 的训练资料是人们创造出来的

Text-to-Image

Stable Diffusion

内部有三个元件

1、Text Encoder:好的文字的encoder,会把一段文字变成向量

2、Generation Model:可以用其他model(如diffusion Model)，用一个粉红色的矩阵表示以恶搞噪声，将噪声与文字的encode产生一个中间产物（为一张图片被压缩后的结果）

3、Decoder:把图片压缩后的版本还原成原图

第一元件：如何评估影像生成的模型好坏（常用FID Frechet Inception Distance）

若这两组越接近，则表示生成的影像与原图更接近。

FID需要许多的图片

第三元件：它训练不需要文字的输入，可任意单凭影像的输入自动训练decoder

中间产物为：压缩后的图片

中间产物为：Latent Representation ,则应该如何训练decoder，把其还原成图片

需要训练一个Auto-encoder ,过程如下图所示：

输入和输出的结果越接近越好。把训练好的decoder直接拿出来将Latent Representation还原成图片即可。

第二元件：generation model

diffusion model的数学原理

Training

第三行表示从1-T sample一个数出来，第四行表示从normal distribution sample一个 $\varepsilon$

第五行红色方框表示T越大表示所加的噪声越多

想象中噪声是一点一点加进去的，去噪声也是把噪声一点一点的抹去，实际上真正做的事情并没有把噪声一点一点的加进去，噪声一次加入，去噪声也是一次便去除

sampling

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

基于Springboot物流在线下单系统网站设计与实现(作品+论文+开题报告) XX县旅游度假村开发项目可行性分析与实施 Burp Suite Professional 2025.3 for macOS x64 ARM64 - 新增 Burp AI 通过人工智能增强安全测试工作流程外贸网站建设公司独立站建设公司有哪家? AP 微观经济——自己的复习笔记 20244111 实验二《Python程序设计》实验报告

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989