自从黑森林实验室推出了FLUX.1,这款被视为Stable Diffusion精神续作的模型,引起了业界的广泛关注。FLUX.1不仅在技术上进行了改进,还包含了三个变种模型,并且其中一个版本FLUX.1[schnell]实现了完全开源,体现了团队的开源精神。与此同时,美国初创公司Fal.ai也发布了开源模型Auraflow,旨在延续开源社区的传统。这两款新模型的出现,为AI图像生成领域带来了新的活力。
SD3面前,连Auraflow都“很能打”?
为了评估这些新模型的实际表现,我们选取了几种不同的风格进行测试,包括动漫风、奇幻风、印象派艺术风、写实场景、人像摄影和家居广告等。参与测试的模型包括FLUX.1的三个版本:FLUX.1[pro]、FLUX.1[dev]、FLUX.1[schnell],以及SD3Medium和Fal.ai自研的Auraflow。
测试结果显示,在多个风格的生成任务中,FLUX.1系列模型展现出了领先的实力,特别是在家居设计、人像摄影和电商图片的生成质量方面。相比之下,Auraflow在艺术风格的生成上表现突出,尤其是在奇幻风、动漫风和印象派风格方面,但在写实风格上则略逊一筹。
新的开源基座模型能走多远?
FLUX.1的商业模式采用了开源加闭源的方式。FLUX.1[pro]为闭源模型,专为商业用途设计;FLUX.1[dev]和FLUX.1[schnell]则是开源模型,有助于吸引开发者和研究者。这样的设计既能建立品牌影响力,又能通过闭源版本获得商业收益。
另一方面,Fal.ai通过开发Auraflow,进一步巩固了其作为模型托管平台的地位。尽管Auraflow本身采用Apache2.0开源许可证,但Fal.ai通过提供高效的推理引擎和其他服务来盈利。这种模式既促进了开源社区的发展,也为Fal.ai带来了商业价值。
新模型涌现带来的机遇
随着更多新模型的出现,开发者可以根据具体需求灵活选择合适的模型。例如,对于需要创造艺术风格图像的应用,Auraflow是一个不错的选择;而对于追求高质量图像的商业应用,则可以考虑使用FLUX.1[pro]。此外,成本的下降也为更多toC应用的商业模式创造了可能性。
本文来源: 白鲸出海公众号【阅读原文】