自从更新SD1.6以后,大部分AI绘画玩家反馈速度要比以前慢很多,更不要提多次提及的SDXL,关于SDXL的生态问题我们也再次补充提及,那么怎么避免GPU偷懒,CPU累得冒烟,风扇疯狂旋转,出图却仍然慢的问题呢?
2倍速提升显卡性能
选择对应自己的显卡
RTX VSR 1.5 版本带来更高质量并适用于 GeForce RTX 20 系列
RTX VSR 视频超分辨率 (RTX Video Super Resolution) 于今年早些时候在 CES 上推出,它利用 AI 消除压缩伪影,并在放大视频时锐化边缘,从而增强您在线观看的任何视频。
今天的 Game Ready 驱动中包含最新 1.5 版本更新,进一步提高了 RTX 视频超分辨率的质量,在放大过程中提高了细节水平并保留了图像细节,从而使图像整体更加清晰。此外,借助扩展的 RTX VSR 支持,GeForce RTX 20 系列 GPU 的用户可以像 RTX 30 和 40 系列 GPU 的用户一样,在视频中受益于 AI 增强的功能。
借助 RTX 加速,Stable Diffusion 性能实现大幅提升
Stable Diffusion 是一款热门的生成式 AI 工具,用户可通过 Stable Diffusion 从简单文本描述生成图像,使用 Stable Diffusion 最常见的方法之一是通过 Automatic1111 的 Stable Diffusion Web UI。在今天发布的 Game Ready 驱动中,我们为 Stable Diffusion Web UI 添加了 TensorRT 加速技术,可将 GeForce RTX 性能最高提升至 2 倍。
关于稳定扩散和自动扩散1111 稳定扩散是一种基于生成AI图像的模型,允许用户从简单的文本描述中生成图像。用户通常通过为其提供 UI 和高级功能的发行版访问此模型。此类发行版中最受欢迎的是来自Automatic1111的Web UI。
支持 TensorRT 扩展支持 :
- 文本 2 图像和图像 2 图像
- 稳定扩散 1.5 和 2.1
- 洛拉
对 SDXL 的支持将在将来的修补程序中提供。
最低要求
显卡 | NVIDIA RTX GPU 具有 8GB VRAM |
---|---|
显存 | 16GB 内存 |
连接 | 安装期间的互联网连接 |
驱动 | NVIDIA Studio 驅動程序 537.58、遊戲就绪驅動程序 537.58、NVIDIA RTX 企業驅動程序 537.58 及更高版本。 |
- 单击“生成默认引擎”按钮。此步骤需要 2-10 分钟,具体取决于您的 GPU。您可以为其他组合生成引擎。
- 转到“设置”→“用户界面”→“快速设置列表”,添加sd_unet。应用这些设置,然后重新加载 UI。
- 返回主 UI,从页面顶部的sd_unet下拉菜单中选择 TRT 模型。
- 您现在可以开始生成由 TRT 加速的图像。如果您需要创建更多引擎,请转到 TensorRT 选项卡。
TensorRT使用针对特定分辨率和批量大小的优化引擎。您可以根据需要生成任意数量的优化引擎。类型:
- “导出默认引擎”选项增加了对稳定扩散 512.512 的 768x768 和 1x5 之间的分辨率的支持,对于批量大小为 768 到 768 的 SDXL,支持 1024x1024 到 1x4。
- 静态引擎支持单个特定的输出分辨率和批次大小。
- 动态引擎支持各种分辨率和批量大小,但性能成本很小。范围越广,使用更多的VRAM。
每个预设都可以使用“高级设置”选项进行调整
系统要求
- Linux:>= 450.80.02
- 窗口:>=452.39
我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!