返回
首页 > 数码科技

StableDiffusion3.5模型全家桶亮相:含三个不同版本

时间: 2024-10-25 本站作者

就在近日,Stability AI 推出了令人瞩目的 Stable Diffusion 3.5 模型全家桶,包含三个不同版本。

其中,Stable Diffusion 3.5 Large 拥有高达 80 亿参数,性能卓越,响应迅速,堪称专业领域的强大工具,尤其适合 100 万像素分辨率的应用。

Stable Diffusion 3.5 Large Turbo 作为前者的蒸馏版本,仅需四步就能生成高质量图像,速度优势明显。

而 Stable Diffusion 3.5 Medium 拥有 25 亿参数,采用先进的 MMDiT-X 架构和训练方法,能在消费级硬件上“开箱即用”,实现了质量与定制易用性的平衡,可生成 0.25 到 200 万像素分辨率的图像。

在开发过程中,Stability AI 优先考虑可定制性,将 Query-Key Normalization 集成到 transformer 块中,稳定训练过程并简化开发。

为支持下游灵活性,他们还做出权衡,同一提示使用不同种子可能产生较大输出差异,但有助于保留广泛知识库和多样风格。

不过,缺乏特异性提示可能导致输出不确定性增加和美学水平不同,尤其针对 Medium 版本,Stability AI 对架构和训练协议进行调整,以提升质量、连贯性和多分辨率生成能力。

从各方面表现来看,Stable Diffusion 3.5 版本模型优势显著。

其具备可定制性,能满足特定创作需求或构建应用程序;高效性能突出,在标准消费级硬件上运行出色,特别是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号;多样化输出丰富,无需大量提示就能创建代表全球的图像;风格多样,能生成各种风格和美感的图片。

此外,Stability AI 表示 Stable Diffusion 3.5 Large 在 prompt adherence 方面领先,图像质量可与更大型号媲美。

Stable Diffusion 3.5 Large Turbo 推理速度在同类模型中最快,同时在图像质量和及时性上保持竞争力。

Stable Diffusion 3.5 Medium 表现优于其他中型型号,平衡了 prompt adherence 和图像质量,是高效高质量性能的首选。

有人还第一时间对比了 Stable Diffusion 3.5 Large 与 FLUX 1.1 pro 的生图效果。

StableDiffusion3.5模型全家桶亮相:含三个不同版本

除了在 Hugging Face 上托管的模型,还有多种访问新模型的方式,如 Stability AI API、Replicate、ComfyUI 以及 DeepInfra。

同时,Stability AI 从开发早期阶段就引入安全、负责任的 AI 实践。

并且 Stability AI 称,Stable Diffusion 3.5 Medium 将在 10 月 29 日公开,不久后 ControlNets 也将推出,为专业用例提供高级控制功能。

猜你喜欢

版权所有 Copyright©2023 餐饮美食网 版权所有

粤ICP备15109582号

联系邮箱:hueiji88@gmail.com