Stable Diffusion是一种基于扩散模型(Diffusion Models)的生成技术,近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景,迅速在学术界和工业界引起了广泛关注。
以下是关于Stable Diffusion的详细介绍。
01 Diffusion Model的概念
在前向的过程中,不断地向数据中加入噪音,让图像由原本的状态转化为噪音点,最后变成纯噪声。加入的噪声要满足固定的分布,比如标准的高斯分布。前向的过程也称为扩散的过程。
图:向原始图片中线性添加噪声的变化过程
扩散模型的逆向过程是利用贝叶斯公式,从噪声图片中一步一步的去噪,倒推拟合加上噪音前的那张图片。扩散模型的逆向过程也可以用信息熵的变化来解释。从高熵的纯噪声状态开始,逐步减少数据的随机性和不确定性,通过去噪过程逐步恢复原始数据的结构和特征。
Diffusion Model总结为“前向加噪-反向降噪-训练”的结构。
02 Stable Diffusion介绍
Stable Diffusion建立在Latent Diffusion Models的基础上,借鉴了Google的Imagen,实现了将文字prompt作为条件参与到扩散模型的生成过程中。扩散模型不同于VAE和GAN,扩散模型是从噪音点中一步一步生成,因此需要的计算资源更多。Stable Diffusion可以规避模式坍塌的问题
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)