黑森林实验室发布FLUX.1：由Stable Diffusion原团队打造，旨在成为领先的图像与视频生成模型

引言

随着技术的飞速发展，开源图像生成模型领域迎来了新的竞争者。黑森林实验室，由Stable Diffusion的核心团队创立，近日推出了其最新的图像生成模型FLUX.1，这款模型以其卓越的表现迅速引起了业界的关注。

模型亮点

FLUX.1提供了三种不同版本的模型：专业版、开发者版和快速版。这些模型在文字生成、复杂构图以及人手描绘方面表现出色。尤其值得一提的是，即便是快速版的FLUX.1[schnell]也能在保持高质量的同时实现快速生成，这使得它在同类模型中脱颖而出。

技术表现

在性能测试中，FLUX.1[pro]和FLUX.1[dev]两款模型均超越了市场上其他主流模型，如Midjourney v6.0、DALL·E 3等。即使是轻量级的FLUX.1[schnell]，其性能也超越了许多大型模型。这些成就得益于团队采用了基于多模态和并行扩散Transformer模块的混合架构，并通过流匹配和旋转位置嵌入等技术提高了模型的效率。

团队背景与融资

黑森林实验室由Stable Diffusion的核心研发团队组建，该团队在高质量图像生成方面有着丰富的经验。目前，黑森林实验室已成功完成了3100万美元的种子轮融资，这一成绩得到了来自a16z、Oculus CEO Brendan Iribe等知名投资者的支持。

未来展望

除了在图像生成领域的突破，黑森林实验室还计划发布一款领先的视频生成模型，旨在让用户能够轻松地将文本转化为视频。这款即将推出的模型预计将继承FLUX.1的优势，并进一步推动多媒体生成技术的发展。

本文来源：