06 - 模型推荐与对比 | Stable Diffusion

🏷️难度：入门 ⏱️预计阅读：15 分钟 📅更新时间：2026-02-28

模型推荐与对比：SD 1.5 到 SDXL 甚至 SD3

在拥有一套可运行的 SD 环境后，选择合适的模型（Checkpoint）是画出想要作品的最重要因素。模型之间不能随意混用，因为它们的"底层代沟"极深。本文将简要梳理各大世代的核心生态。

最早期大家分享模型都用 .ckpt (Pickle) 格式，但它有严重的安全隐患（里面可能被人嵌入恶意执行的 Python 代码脚本）。

请务必只下载后缀为 .safetensors 的模型格式。 它移除了执行代码的功能，属于纯粹的数据张量块，这现在也是社区的绝对标准。

SD 1.5 是迄今为止生态最庞大、插件最丰富、出图速度最快的版本。虽然官方训练的分辨率只有 512x512，但通过社区微调，它至今扛起了 AI 绘画半壁江山。

写实风格 (Realistic):
- ChilloutMix：亚洲面孔、真实风格、网红脸的开山鼻祖。
- MajicMIX realistic：在真实感、光影表现和皮肤纹理上更为出色和自然。
- Realistic Vision：主修欧美硬核胶片感和真实粗糙纹理的行业标杆。
二次元风格 (Anime):
- Anything V5：顾名思义"画什么都行"的泛二次元极品模型。对丹布鲁标签有着极高的响应度。
- Counterfeit-V3.0：以背景构图与精细线条插画见长的大模型。
- MeinaMix：主打赛璐璐画风与独特的油画混合质感。
2.5D 与 3D 风格:
- ReV Animated：手办质感、厚涂 CG 插画界的天花板。
- GhostMix：融合了 3D 和二次元特点的赛博科幻风。

⚠️ 1.5 的局限性

SD 1.5 先天双手容易画崩（手指多/少），并且几乎无法直接生成清晰正确的文字。你几乎严重依赖各类 ControlNet 才能画出复杂的画面。

2023 年发布的 SDXL 将原生分辨率提升至 1024x1024 级别。它的参数量比 1.5 版本大了好几倍。

核心进化点：

代价与硬件门槛：

单个模型体积达到 6.5GB 以上！
对显存的要求极高，推荐 12GB 或 16GB 显存显卡，8GB 会比较吃力。
不兼容提醒： 所有基于 1.5 训练的 LoRA 和旧版本 ControlNet 都无法在 SDXL 大模型下直接加载运行！社区生态经历了推倒重来。

SD3 放弃了之前的纯 U-Net 步入式生成，转向了类似于 Sora 背后的 DiT (Diffusion Transformer) 架构。

SD3 在理解长段落提示词表现出惊人素质（甚至不需要写那一串逗号分隔的咒语词汇，直接用流利的英文句子对话即可）。目前开源版仅供研究，生态起步尚需时间。

首选：Civitai (C站) - 全球模型创作者集散地。找带有 Checkpoint 标签文件下载。注意部分成人内容模型默认需登录账号通过过滤查看。
次选：Hugging Face - 学术气息浓厚，偏向官方发布，由于外网墙的原因部分连通性差。
备选：LibLib AI (哩布) - 国内发展最好的合规化模型社区，服务器连线顺畅。