
工具推荐
1722739887更新
0
Black Forest Labs推出了开源文生图系列模型:FLUX.1。FLUX.1在图像细节、提示词遵循、风格多样性和场景复杂性方面都取得了SOTA,超越了Midjourney、DALL-E和Stable Diffusion等其他图像模型 。
2024年3月,Robin Rombach与其他Stable Diffusion核心团队成员一同离开了Stability AI。随后,他领衔创立了Black Forest Lab(黑森林实验室) 。Black Forest Labs的核心信念是推动开源,促进研究界和学术界的创新与合作,提高透明度 。
FLUX.1系列模型融合了多模态和并行扩散Transformer的混合架构,并扩展到120亿参数 。不仅在视觉质量上达到了前所未有的水平,更在文字生成、复杂构图、人手描绘等方面展现了卓越的能力。流匹配技术、旋转位置嵌入和并行注意力层的引入,让FLUX.1在生成效率和质量上实现了质的飞跃。它们不仅能够精确捕捉文本提示的细微差别,更能在多样化的场景中创造出丰富、细腻的图像,满足从商业到个人,从研究到应用的广泛需求。
FLUX.1系列模型包含三个不同的版本,每个版本针对不同的用例进行了优化:FLUX.1 [pro]:这是旗舰模型,提供最顶尖的性能,具有卓越的图像质量、细节和多样性,非常适合需要顶级效果的专业应用,该模型是闭源版本,仅通过 API 提供服务。FLUX.1 [dev]:这是pro模型的指导蒸馏变体。它提供与pro版本类似的质量和响应能力,非常适合研究和开发用途。FLUX.1 [schnell]:这是为速度优化的模型,适合本地开发和个人项目。
Black Forest Labs已经完成3100万美元的种子轮融资,由Andreessen Horowitz领投,并获得General Catalyst等的后续投资 。此外,FLUX.1 [dev]和FLUX.1 [schnell]的推理代码和权重已经放在了GitHub上,而FLUX.1 [schnell]也可以在Hugging Face上使用 。
Black Forest Labs还预告了不久之后将发布SOTA视频模型,从Demo来看,无论是流畅度、稳定性还是物理模拟都达到了第一梯队水平,预示着该公司可能成为视频生成领域的一匹黑马 。