Jensen的个人学习小站

🏷️难度:入门 ⏱️预计阅读:15 分钟 📅更新时间:2026-02-28

模型推荐与对比:SD 1.5 到 SDXL 甚至 SD3

目录
  1. 模型格式科普:Ckpt vs Safetensors
  2. 经典不朽:SD 1.5 时代的王者
  3. 世代升级:SDXL 的特征与适配要求
  4. 未来一瞥:SD3 革命性的架构
  5. 模型资源去哪里找?

在拥有一套可运行的 SD 环境后,选择合适的模型(Checkpoint)是画出想要作品的最重要因素。模型之间不能随意混用,因为它们的"底层代沟"极深。本文将简要梳理各大世代的核心生态。

1. 模型格式科普:Ckpt vs Safetensors

最早期大家分享模型都用 .ckpt (Pickle) 格式,但它有严重的安全隐患(里面可能被人嵌入恶意执行的 Python 代码脚本)。

请务必只下载后缀为 .safetensors 的模型格式。 它移除了执行代码的功能,属于纯粹的数据张量块,这现在也是社区的绝对标准。

2. 经典不朽:SD 1.5 时代的王者 (512x512)

SD 1.5 是迄今为止生态最庞大、插件最丰富、出图速度最快的版本。虽然官方训练的分辨率只有 512x512,但通过社区微调,它至今扛起了 AI 绘画半壁江山。

⚠️ 1.5 的局限性

SD 1.5 先天双手容易画崩(手指多/少),并且几乎无法直接生成清晰正确的文字。你几乎严重依赖各类 ControlNet 才能画出复杂的画面。

3. 世代升级:SDXL 的特征与适配要求 (1024x1024)

2023 年发布的 SDXL 将原生分辨率提升至 1024x1024 级别。它的参数量比 1.5 版本大了好几倍。

核心进化点:

代价与硬件门槛:

4. 未来一瞥:SD3 革命性的架构

SD3 放弃了之前的纯 U-Net 步入式生成,转向了类似于 Sora 背后的 DiT (Diffusion Transformer) 架构。

SD3 在理解长段落提示词表现出惊人素质(甚至不需要写那一串逗号分隔的咒语词汇,直接用流利的英文句子对话即可)。目前开源版仅供研究,生态起步尚需时间。

5. 模型资源去哪里找?