黑森林实验室发布FLUX.1:由Stable Diffusion原团队打造,旨在成为领先的图像与视频生成模型

引言

随着技术的飞速发展,开源图像生成模型领域迎来了新的竞争者。黑森林实验室,由Stable Diffusion的核心团队创立,近日推出了其最新的图像生成模型FLUX.1,这款模型以其卓越的表现迅速引起了业界的关注。

模型亮点

FLUX.1提供了三种不同版本的模型:专业版、开发者版和快速版。这些模型在文字生成、复杂构图以及人手描绘方面表现出色。尤其值得一提的是,即便是快速版的FLUX.1[schnell]也能在保持高质量的同时实现快速生成,这使得它在同类模型中脱颖而出。

技术表现

在性能测试中,FLUX.1[pro]和FLUX.1[dev]两款模型均超越了市场上其他主流模型,如Midjourney v6.0、DALL·E 3等。即使是轻量级的FLUX.1[schnell],其性能也超越了许多大型模型。这些成就得益于团队采用了基于多模态和并行扩散Transformer模块的混合架构,并通过流匹配和旋转位置嵌入等技术提高了模型的效率。

团队背景与融资

黑森林实验室由Stable Diffusion的核心研发团队组建,该团队在高质量图像生成方面有着丰富的经验。目前,黑森林实验室已成功完成了3100万美元的种子轮融资,这一成绩得到了来自a16z、Oculus CEO Brendan Iribe等知名投资者的支持。

未来展望

除了在图像生成领域的突破,黑森林实验室还计划发布一款领先的视频生成模型,旨在让用户能够轻松地将文本转化为视频。这款即将推出的模型预计将继承FLUX.1的优势,并进一步推动多媒体生成技术的发展。

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...