在图像生成前,模型会首先在Latent Space中生成一个完全随机的图像,然后噪声预测器会开始工作,从图像中减去预测的噪声。随着这个步骤的不断重复,最终我们得到了一个清晰的图像。Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪的过程,即为采样,使用的采样手段,即为采样器或称为采样方法,
1.什么是VAE
一个标准的Stable Diffusion分为两个步骤;前向扩散过程,和后向的去噪、复原以及生成目标的过程。前向过程不断向输入数据中添加噪声,而采样器主要在后向过程中负责去噪的过程。
VAE:包括Encoder编码器和Decoder解码器,用于图像从像素空间到潜空间的转换,或者叫降维或升维,由于用于降维的VAE Encoder 只在训练模型的阶段使用,推理过程(图像生成)只需要VAE Decoder解码器就ok了,而网上常见的VAE文件,就是对这个VAE Decoder解码器的微调改进版本,用于解决角色面部眼睛等细节方面的问题。
2.VAE
存放位置:
代码语言:javascript复制./stable-diffusion-webui/models/vae
3.放大算法
存放位置:
代码语言:javascript复制./stable-diffusion-webui/models/ESRGAN
回到首页
测试条件
版本SD1.5
测试底模:realistic
测试分辨率:512 * 512
步数:20步
稳定性:
无搭配任何Lora和插件不启动面部修复
提示词:1girl, moyou, solid background, solid background, full body
反向提示词:(dedicated_to_artificial_humans:1.2)
版本SDXL
测试底模:BASE REFINER
测试分辨率:512 * 512
步数:20步
无搭配任何Lora和插件不启动面部修复
我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!