模型推荐与对比:SD 1.5 到 SDXL 甚至 SD3
在拥有一套可运行的 SD 环境后,选择合适的模型(Checkpoint)是画出想要作品的最重要因素。模型之间不能随意混用,因为它们的"底层代沟"极深。本文将简要梳理各大世代的核心生态。
1. 模型格式科普:Ckpt vs Safetensors
最早期大家分享模型都用 .ckpt (Pickle) 格式,但它有严重的安全隐患(里面可能被人嵌入恶意执行的 Python 代码脚本)。
请务必只下载后缀为 .safetensors 的模型格式。 它移除了执行代码的功能,属于纯粹的数据张量块,这现在也是社区的绝对标准。
2. 经典不朽:SD 1.5 时代的王者 (512x512)
SD 1.5 是迄今为止生态最庞大、插件最丰富、出图速度最快的版本。虽然官方训练的分辨率只有 512x512,但通过社区微调,它至今扛起了 AI 绘画半壁江山。
- 写实风格 (Realistic):
ChilloutMix:亚洲面孔、真实风格、网红脸的开山鼻祖。MajicMIX realistic:在真实感、光影表现和皮肤纹理上更为出色和自然。Realistic Vision:主修欧美硬核胶片感和真实粗糙纹理的行业标杆。
- 二次元风格 (Anime):
Anything V5:顾名思义"画什么都行"的泛二次元极品模型。对丹布鲁标签有着极高的响应度。Counterfeit-V3.0:以背景构图与精细线条插画见长的大模型。MeinaMix:主打赛璐璐画风与独特的油画混合质感。
- 2.5D 与 3D 风格:
ReV Animated:手办质感、厚涂 CG 插画界的天花板。GhostMix:融合了 3D 和二次元特点的赛博科幻风。
⚠️ 1.5 的局限性
SD 1.5 先天双手容易画崩(手指多/少),并且几乎无法直接生成清晰正确的文字。你几乎严重依赖各类 ControlNet 才能画出复杂的画面。
3. 世代升级:SDXL 的特征与适配要求 (1024x1024)
2023 年发布的 SDXL 将原生分辨率提升至 1024x1024 级别。它的参数量比 1.5 版本大了好几倍。
核心进化点:
- 原图直出素质大大提升: 皮肤细节和手部的正确率显著提高。
- 文字生成能力: 你终于可以在提示词写
holding a sign saying "HELLO"并且能成功在一半概率得到这四个字母了。 - 提示词理解力增强: 对复杂空间关系(如"A 站在 B 左边,A 穿红衣服,B 穿蓝衣服")的理解比 1.5 强。
代价与硬件门槛:
- 单个模型体积达到 6.5GB 以上!
- 对显存的要求极高,推荐 12GB 或 16GB 显存显卡,8GB 会比较吃力。
- 不兼容提醒: 所有基于 1.5 训练的 LoRA 和旧版本 ControlNet 都无法在 SDXL 大模型下直接加载运行!社区生态经历了推倒重来。
4. 未来一瞥:SD3 革命性的架构
SD3 放弃了之前的纯 U-Net 步入式生成,转向了类似于 Sora 背后的 DiT (Diffusion Transformer) 架构。
SD3 在理解长段落提示词表现出惊人素质(甚至不需要写那一串逗号分隔的咒语词汇,直接用流利的英文句子对话即可)。目前开源版仅供研究,生态起步尚需时间。
5. 模型资源去哪里找?
- 首选:Civitai (C站) - 全球模型创作者集散地。找带有
Checkpoint标签文件下载。注意部分成人内容模型默认需登录账号通过过滤查看。 - 次选:Hugging Face - 学术气息浓厚,偏向官方发布,由于外网墙的原因部分连通性差。
- 备选:LibLib AI (哩布) - 国内发展最好的合规化模型社区,服务器连线顺畅。