Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型 [2]. 具体来说,Stable Diffusion采用 UNetModel 这种 Encoder-Decoder 结构来实现扩散的过程 [1]. 在Stable Diffusion中,通过将人类语言转换成机器能理解的数学向量,再结合语义向量,从纯噪声开始逐步去除噪声,生成图片信息隐变量,最后将图片信息隐变量转换为一张真正的图片.
Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型 [2]. 具体来说,Stable Diffusion采用 UNetModel 这种 Encoder-Decoder 结构来实现扩散的过程 [1]. 在Stable Diffusion中,通过将人类语言转换成机器能理解的数学向量,再结合语义向量,从纯噪声开始逐步去除噪声,生成图片信息隐变量,最后将图片信息隐变量转换为一张真正的图片.