AUTOMATIC1111 Stable Diffusion WebUI:AI 绘画的本地入口

AUTOMATIC1111 Stable Diffusion WebUI:AI 绘画的本地入口

AUTOMATIC1111/stable-diffusion-webui 在 GitHub 上已经拿到 163,171 Star 了。

这是一个基于 Gradio 的 Stable Diffusion 图形界面。2022 年 Stable Diffusion 开源后,命令行操作门槛不低,这个项目把模型推理、参数调节、图片生成全装进了浏览器页面里。

正文顶部截图

1、它能做什么

核心功能围绕 txt2img 和 img2img 两个模式展开。输入文字描述生成图片,或者拿一张图做二次创作,这是基础。在此基础上,它塞进了大量实用工具。

Outpainting 和 Inpainting 可以扩展画面边界、局部重绘。Prompt Matrix 一次跑多组提示词对比效果。X/Y/Z plot 能画出三维参数网格,直观看出某个参数对结果的影响。Loopback 让 img2img 多轮迭代,逐步细化画面。

注意力语法支持 ((tuxedo))(tuxedo:1.21) 这样的写法,控制模型对特定词汇的关注度。选中文本按 Ctrl+Up / Ctrl+Down 还能自动调节权重。Negative prompt 字段可以列出你不希望出现在画面里的内容。Styles 功能支持保存常用提示词片段,以后下拉菜单直接调用。

训练相关也没落下。Textual Inversion、Hypernetworks、LoRAs 都支持,8GB 显存就能跑嵌入训练。Extras 标签页集成了 GFPGAN、CodeFormer 人脸修复,RealESRGAN、ESRGAN、SwinIR 等超分模型,一键提升画质。

README区域截图

2、为什么选它

Stable Diffusion 的 GUI 工具有不少,这个项目的优势在于生态和兼容性。

显存门槛压得低。官方标称 4GB 显存可用,社区有 2GB 成功的报告。这意味着大量中低端显卡也能本地跑图。Windows、Linux、macOS 全平台支持,NVIDIA、AMD、Intel 核显/独显、甚至 Apple Silicon 和华为昇腾 NPU 都有对应安装指南。

扩展机制开放。社区写了大量自定义脚本和插件,从图库浏览器到美学梯度,从历史记录管理到批量处理,装进去就能用。Checkpoint Merger 支持把最多三个模型合并成一个,方便实验混合风格。API 接口也提供了,方便外部程序调用。

生成参数自动嵌入图片。PNG 保存在 chunks 里,JPEG 写在 EXIF 中。把图拖回 PNG info 标签页,参数自动还原到界面,复现结果变得简单。

3、安装方式

Windows 用户最省事:下载 release 包里的 sd.webui.zip,解压后先跑 update.bat 再跑 run.bat。或者手动装 Python 3.10.6 和 git,clone 仓库后执行 webui-user.bat

Linux 用户装完依赖后,wget 拉取 webui.sh 直接运行即可。Arch、Debian、Red Hat 系的包管理命令 README 里都列好了。macOS 和各类特殊硬件也有专门 wiki 页面指导。

4、适合谁用

  • 想本地跑 Stable Diffusion、不想折腾命令行的用户
  • 需要精细控制生成参数、对比不同设置效果的创作者
  • 有训练需求、想自己做 Textual Inversion 或 LoRA 的人
  • 显存有限、希望在中低端硬件上运行 AI 绘画的开发者

这个项目没有花哨的包装,就是一个功能密集、兼容性强的本地推理入口。163K Star 背后,是社区两年多的持续迭代和插件生态的积累。

posted @ 2026-06-22 10:08  小飞技术快餐  阅读(14)  评论(0)    收藏  举报