发布即SOTA，Black Forest Labs发布开源文生图系列模型：FLUX.1-AI工具推荐-AI工具导航

发布即SOTA，Black Forest Labs发布开源文生图系列模型：FLUX.1

Black Forest Labs推出了开源文生图系列模型：FLUX.1。FLUX.1在图像细节、提示词遵循、风格多样性和场景复杂性方面都取得了SOTA，超越了Midjourney、DALL-E和Stable Diffusion等其他图像模型。

2024年3月，Robin Rombach与其他Stable Diffusion核心团队成员一同离开了Stability AI。随后，他领衔创立了Black Forest Lab（黑森林实验室）。Black Forest Labs的核心信念是推动开源，促进研究界和学术界的创新与合作，提高透明度。

FLUX.1系列模型融合了多模态和并行扩散Transformer的混合架构，并扩展到120亿参数。不仅在视觉质量上达到了前所未有的水平，更在文字生成、复杂构图、人手描绘等方面展现了卓越的能力。流匹配技术、旋转位置嵌入和并行注意力层的引入，让FLUX.1在生成效率和质量上实现了质的飞跃。它们不仅能够精确捕捉文本提示的细微差别，更能在多样化的场景中创造出丰富、细腻的图像，满足从商业到个人，从研究到应用的广泛需求。

FLUX.1系列模型包含三个不同的版本，每个版本针对不同的用例进行了优化：FLUX.1 [pro]：这是旗舰模型，提供最顶尖的性能，具有卓越的图像质量、细节和多样性，非常适合需要顶级效果的专业应用，该模型是闭源版本，仅通过 API 提供服务。FLUX.1 [dev]：这是pro模型的指导蒸馏变体。它提供与pro版本类似的质量和响应能力，非常适合研究和开发用途。FLUX.1 [schnell]：这是为速度优化的模型，适合本地开发和个人项目。

Black Forest Labs已经完成3100万美元的种子轮融资，由Andreessen Horowitz领投，并获得General Catalyst等的后续投资。此外，FLUX.1 [dev]和FLUX.1 [schnell]的推理代码和权重已经放在了GitHub上，而FLUX.1 [schnell]也可以在Hugging Face上使用。

Black Forest Labs还预告了不久之后将发布SOTA视频模型，从Demo来看，无论是流畅度、稳定性还是物理模拟都达到了第一梯队水平，预示着该公司可能成为视频生成领域的一匹黑马。