Stable Diffusion本地运行需NVIDIA显卡(计算能力≥6.0、独立显存≥4GB GDDR5/6)、正确驱动与CUDA环境;Windows推荐秋叶整合包或手动部署,Mac仅限M系列芯片且性能受限;显存不足时应降分辨率、关高耗模块并设显存上限。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您准备在本地运行Stable Diffusion,但启动失败或报错“CUDA out of memory”“no module named torch”等,很可能是显卡不兼容或安装流程缺失关键依赖。以下是针对Windows平台的完整安装路径与显卡配置核查步骤:
一、显卡硬件准入门槛
Stable Diffusion依赖CUDA加速,仅支持NVIDIA显卡;AMD与Intel核显无法启用核心推理功能,将退化为极低效CPU模式甚至无法启动。必须满足以下三项硬性指标:
1、显卡品牌与架构:必须为NVIDIA GPU,且计算能力(Compute Capability)≥6.0,即GTX 10系列(如1050 Ti)、RTX 20/30/40系列全系可用;GTX 9xx及更早型号、MX系列(如MX150/MX350)均不支持。
2、显存容量与类型:显存不低于4GB GDDR5/GDDR6,且必须为独立显存(非共享内存);集成显卡(如NVIDIA MX芯片或Intel Iris Xe)即使标称“4GB”也因无独立显存控制器而不可用。
3、驱动与CUDA环境:需安装官方最新Game Ready或Studio驱动(≥535.0版本),并确保系统中CUDA Toolkit已由WebUI自动部署或手动验证通过;可通过命令行执行nvidia-smi确认GPU识别状态,执行nvcc --version验证CUDA编译器存在。
二、Windows一键整合包安装法
该方法规避Python/Git手动配置,适合新手及低配设备,以秋叶A绘世启动器为例:
1、下载整合包:访问可信源获取含Python 3.10.6、Git 2.4x、xFormers预编译库的完整包,文件名通常含“SD-WebUI-Automatic1111”与日期标识。
2、解压路径选择:必须解压至非C盘根目录(如D:\StableDiffusion),且路径不含中文、空格或特殊符号。
3、首次启动校验:双击,勾选“我已阅读协议”,点击“一键启动”;若弹出.NET Framework 6.0安装提示,按默认路径完成安装后再重启启动器。
4、显存参数预设:启动前在启动器界面勾选“medvram”或“lowvram”(4–6GB显存选前者,≤4GB选后者),禁用“xFormers”以外的第三方加速插件。
三、手动源码部署法
适用于需定制PyTorch版本、调试插件或使用Conda虚拟环境的进阶用户:
1、安装Python 3.10.6:从python.org下载Windows x64安装包,安装时务必勾选“Add Python to PATH”,并取消“Disable path length limit”选项。
2、安装Git:从git-scm.com下载64位安装程序,全程保持默认设置,确保安装路径不含空格(如C:\Program Files\Git → 改为C:\Git)。
3、克隆WebUI仓库:打开CMD或PowerShell,执行git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git,等待完成。
4、模型文件置入:从Hugging Face下载sd-v1-5.safetensors或sd_xl_base_1.0.safetensors,放入webui根目录下的models\Stable-diffusion\子文件夹。
5、启动参数注入:编辑webui-user.bat,在set COMMANDLINE_ARGS=后添加--medvram --no-half(4–6GB显存)或--lowvram --no-half --precision full(≤4GB显存)。
四、Mac平台限制性部署
macOS仅通过Metal后端运行,性能损失显著,且多数高级功能被屏蔽:
1、硬件强制要求:M1/M2/M3 Pro或Max芯片机型,统一内存≥16GB;M1基础版(8GB)及Air系列无法加载768×768以上分辨率模型。
2、系统与工具链:macOS 13.0(Ventura)及以上,Homebrew已安装,Xcode Command Line Tools已就绪。
3、启动方式差异:终端执行./webui.sh --skip-torch-cuda-test --use-cpu all强制CPU回退;若坚持GPU加速,需额外安装pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu并禁用所有CUDA相关参数。
五、显存不足应急处置
即使显卡达标,仍可能因参数过载触发OOM错误,须立即干预:
1、降低生成分辨率:将Width/Height从768×768降至512×512,可减少约40%显存占用。
2、关闭冗余功能:禁用高清修复(Hires.fix)、人脸修复(CodeFormer)、Refiner模型切换三项高消耗模块。
3、参数级压缩:在Settings→Stable Diffusion中将“总显存占用上限”设为显存物理值的75%(如12GB卡填9216MB),并启用“Pin shared memory”选项。










