StableDiffusion3.5模型全家桶亮相：含三个不同版本

时间: 2024-10-25 本站作者

就在近日，Stability AI 推出了令人瞩目的 Stable Diffusion 3.5 模型全家桶，包含三个不同版本。

其中，Stable Diffusion 3.5 Large 拥有高达 80 亿参数，性能卓越，响应迅速，堪称专业领域的强大工具，尤其适合 100 万像素分辨率的应用。

Stable Diffusion 3.5 Large Turbo 作为前者的蒸馏版本，仅需四步就能生成高质量图像，速度优势明显。

而 Stable Diffusion 3.5 Medium 拥有 25 亿参数，采用先进的 MMDiT-X 架构和训练方法，能在消费级硬件上“开箱即用”，实现了质量与定制易用性的平衡，可生成 0.25 到 200 万像素分辨率的图像。

在开发过程中，Stability AI 优先考虑可定制性，将 Query-Key Normalization 集成到 transformer 块中，稳定训练过程并简化开发。

为支持下游灵活性，他们还做出权衡，同一提示使用不同种子可能产生较大输出差异，但有助于保留广泛知识库和多样风格。

不过，缺乏特异性提示可能导致输出不确定性增加和美学水平不同，尤其针对 Medium 版本，Stability AI 对架构和训练协议进行调整，以提升质量、连贯性和多分辨率生成能力。

从各方面表现来看，Stable Diffusion 3.5 版本模型优势显著。

其具备可定制性，能满足特定创作需求或构建应用程序；高效性能突出，在标准消费级硬件上运行出色，特别是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号；多样化输出丰富，无需大量提示就能创建代表全球的图像；风格多样，能生成各种风格和美感的图片。

此外，Stability AI 表示 Stable Diffusion 3.5 Large 在 prompt adherence 方面领先，图像质量可与更大型号媲美。

Stable Diffusion 3.5 Large Turbo 推理速度在同类模型中最快，同时在图像质量和及时性上保持竞争力。

Stable Diffusion 3.5 Medium 表现优于其他中型型号，平衡了 prompt adherence 和图像质量，是高效高质量性能的首选。

有人还第一时间对比了 Stable Diffusion 3.5 Large 与 FLUX 1.1 pro 的生图效果。

除了在 Hugging Face 上托管的模型，还有多种访问新模型的方式，如 Stability AI API、Replicate、ComfyUI 以及 DeepInfra。

同时，Stability AI 从开发早期阶段就引入安全、负责任的 AI 实践。

并且 Stability AI 称，Stable Diffusion 3.5 Medium 将在 10 月 29 日公开，不久后 ControlNets 也将推出，为专业用例提供高级控制功能。

猜你喜欢