跳转到内容

Flux

维基百科,自由的百科全书
Flux
AI 生成的数位图像,主题为通往森林的小径,背景为山脉
由 Flux 1.1 Pro(Ultra 模式)生成的图像。提示词:請生成一張你覺得能代表你自己的圖像。
原作者黑森林实验室(英语:Black Forest Labs
开发者黑森林实验室
首次发布2024年8月
当前版本Flux 1.1 Pro(模型)[1](2024 年 10 月 2 日)
源代码库 编辑维基数据链接
类型文字转图像模型
许可协议Apache License(Schnell 版本)、非商业授权(Dev 版本)、专有授权(Pro 版本)
网站blackforestlabs.ai

Flux(亦称 FLUX.1)是由总部位于德国弗赖堡的黑森林实验室(英语:Black Forest Labs)所开发的文字转图像模型。该公司由多位前Stability AI员工创办。与其他同类型模型相同,Flux 能够根据自然语言输入(即提示词)生成图像。

历史

[编辑]

黑森林实验室于2024年成立,创办人为Stability AI前员工罗宾・隆巴赫(英语:Robin Rombach)、安德烈亚斯・布拉特曼(英语:Andreas Blattmann)和帕特里克・埃塞尔(英语:Patrick Esser)。[2][3]他们早年在德国慕尼黑大学(英语:Ludwig Maximilian University of Munich)担任 Björn Ommer 的研究助理,专门研究人工智能图像生成技术。[4][5][6]2022 年,他们发表了相关研究成果,并促成了Stable Diffusion的诞生。[6][7]

黑森林实验室的投资者包括创投公司Andreessen Horowitz,以及Brendan Iribe英语Brendan IribeMichael Ovitz英语Michael OvitzGarry Tan英语Garry TanVladlen Koltun英语Vladlen Koltun[8]在创立初期,公司获得 3,100 万美元的投资。[9][10]

2024年8月,Flux被整合进由xAI开发的聊天机器人Grok,并作为 X(前推特)付费功能的一部分提供。[11][12][13][14]Grok于同年12月改用自家开发的文字转图像模型Aurora[15]

2024年11月18日,Mistral AI宣布,其聊天机器人 Le Chat 已整合 Flux Pro 作为图像生成模型。[16][17]

2024年11月21日,黑森林实验室宣布推出图像编辑工具Flux.1 Tools,可搭配现有 Flux 模型使用,这套工具包括:

  • Flux.1 Fill(用于补图与延伸图像边缘,即Inpainting英语Inpainting/outpainting);
  • Flux.1 Depth(依据输入图像的深度图英语depth map与提示词进行控制生成);
  • Flux.1 Canny(依据输入图像的边缘线条进行控制生成);
  • Flux.1 Redux(将不同输入图像与提示词混合生成新图像)。

这些工具皆提供 Dev(开发者)版与 Pro(专业)版两种选择。[18][19]

2025 年 1 月,黑森林实验室宣布与辉达合作,将 Flux 模型纳入其Blackwall微架构的基础模型。[20]同时,该公司推出 Flux Pro 微调 API,供使用者自订与微调图像英语Fine-tuning (deep learning)生成内容,并与德国媒体公司 Hubert Burda Media英语Hubert Burda Media合作,将 Flux Pro 应用于内容制作。[21]

模型

[编辑]

Flux 是一系列基于修正型流式转换器(英语:rectified flow transformer)架构开发的文字转图像模型,参数规模达 120 亿。[8][22]

根据不同版本,Flux 提供三种授权模式:

使用者可以在线上或本机透过界面如ComfyUI英语ComfyUIStable Diffusion WebUI Forge英语Stable Diffusion WebUI Forge(Automatic1111 WebUI 的改良版英语Fork (software development))来使用这些模型。[8][27]

改良后的旗舰模型Flux 1.1 Pro于2024年10月2日推出。[28][29]2024年11月6日,新增两种进阶模式:

此外,Flux 团队正在开发的文字转影片模型SOTA,原预计于2024年底推出。[8]

评价

[编辑]

根据《Ars Technica》的测试,Flux.1 Dev与Pro模型在提示词还原度方面可与DALL-E 3匹敌,而图像写实程度则接近Midjourney 6。相较于 Stable Diffusion XL,Flux对人手的细节呈现更为稳定。[33]

争议

[编辑]

有批评指出Flux生成图像过于写实。媒体报导指出,其生成内容涵盖从川普持枪的图像,到令人不安的场景,引发外界对其伦理与滥用风险的争议。[4][13]

模型推出后,X(前推特)出现大量由Flux所生成的图像,黑森林实验室并未透露其训练资料的具体来源。[34][35][30]《Ars Technica》怀疑Flux是在未经授权的情况下,从网络上大量搜集图像英语Web scraping所训练而成,此作法在法律层面存在争议。[33][36]

第三方整合

[编辑]

虽然黑森林实验室未在其官方网站提供直接存取模型的方式,但Flux模型已在多个第三方平台上广泛提供,供创作者与专业人士使用,包括Hugging Face[37]和Replicate[38]等平台。

参考资料

[编辑]
  1. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  2. ^ Killian, Nicolas. Black Forest Labs: Sie sind ein Teil von jener Kraft需要付费订阅. Die Zeit. 2024-08-27 [2024-11-17]. ISSN 0044-2070. (原始内容存档于4 October 2024) (de-DE). 
  3. ^ Growcoot, Matt. AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E. PetaPixel. 2024-08-05 [2024-11-17] (英语). 
  4. ^ 4.0 4.1 Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…. AlleAktien. 2024-08-22 [2024-11-17] (德语). 
  5. ^ Hermes, Ann Kathrin. Black Forest Labs: KI-Tools aus dem Schwarzwald. trend.at. 2024-08-08 [2024-11-17] (德语). 
  6. ^ 6.0 6.1 Schwär, Hannah. Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt. Capital.de. 2024-08-15 [2024-11-17] (德语). 
  7. ^ High-Resolution Image Synthesis with Latent Diffusion Models. Computer Vision & Learning Group. [2024-11-17]. (原始内容存档于16 November 2024) (美国英语). 
  8. ^ 8.0 8.1 8.2 8.3 Announcing Black Forest Labs. Black Forest Labs. 2024-08-01 [2024-11-17]. (原始内容存档于17 November 2024) (美国英语). 
  9. ^ Steinschaden, Jakob. Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney. Trending Topics. 2024-08-12 [2024-11-17]. (原始内容存档于28 August 2024) (德语). 
  10. ^ Nuñez, Michael. Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator. VentureBeat. 2024-08-01 [2024-11-17]. (原始内容存档于8 October 2024) (美国英语). 
  11. ^ Puscher, Frank. Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen需要付费订阅. MEEDIA. [2024-11-17]. (原始内容存档于27 September 2024) (德语). 
  12. ^ Bomke, Luisa. Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei. Handelsblatt. [2024-11-17]. (原始内容存档于30 August 2024) (德语). 
  13. ^ 13.0 13.1 Weatherbed, Jess. xAI's new Grok-2 chatbots bring AI image generation to X. The Verge. 2024-08-14 [2024-11-17]. (原始内容存档于17 November 2024) (英语). 
  14. ^ Metz, Rachel. This Tiny Startup Is Helping Musk's Grok With Image Generation需要付费订阅. Bloomberg News. 2024-08-21 [2024-11-19] (英语). 
  15. ^ Davis, Wes. X gives Grok a new photorealistic AI image generator. The Verge. 2024-12-07 [2024-12-10]. (原始内容存档于12 December 2024) (英语). 
  16. ^ Mistral has entered the chat. Mistral AI. 2024-11-18 [2024-12-11] (美国英语). 
  17. ^ Franzen, Carl. Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor. VentureBeat. 2024-11-18 [2024-12-11] (美国英语). 
  18. ^ Introducing FLUX.1 Tools. Black Forest Labs. 2024-11-21 [2024-12-13]. (原始内容存档于26 November 2024) (美国英语). 
  19. ^ Bastian, Matthias. Black Forest Labs expands FLUX.1 with four new AI tools for image editing. The Decoder. 2024-11-22 [2024-12-15]. (原始内容存档于22 November 2024) (美国英语). 
  20. ^ Takahashi, Dean. Nvidia unveils AI foundation models running on RTX AI PCs. VentureBeat. 2025-01-07 [2025-01-19]. (原始内容存档于9 January 2025) (美国英语). 
  21. ^ Franzen, Carl. You can now fine-tune your own version of AI image maker Flux with just 5 images. VentureBeat. 2025-01-16 [2025-01-19]. (原始内容存档于24 January 2025) (美国英语). 
  22. ^ black-forest-labs/FLUX.1-dev · Hugging Face. Hugging Face. 2025-04-19 [2025-04-19] (美国英语). 
  23. ^ Get Flux. Black Forest Labs. [2024-11-17]. (原始内容存档于16 November 2024) (美国英语). 
  24. ^ Wiggers, Kyle. Black Forest Labs, the startup behind Grok's image generator, releases an API. TechCrunch. 2024-10-03 [2024-11-17]. (原始内容存档于4 October 2024) (美国英语). 
  25. ^ flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux. GitHub. [2024-11-18]. (原始内容存档于15 September 2024) (英语). Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model. 
  26. ^ API Agreement - BFL Docs (Pro). Black Forest Labs. 2024-08-01 [2024-11-18]. (原始内容存档于3 October 2024). Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. 
  27. ^ 田口和裕. 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6). ASCII.jp. ASCII Media Works. 18 August 2024 [21 November 2024] (日语). 
  28. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  29. ^ Franzen, Carl. Black Forest Labs releases Flux 1.1 Pro and an API. VentureBeat. 2024-10-03 [2024-11-17] (美国英语). 
  30. ^ 30.0 30.1 Growcoot, Matt. Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography'. PetaPixel. 2024-11-07 [2024-11-19] (英语). 
  31. ^ Bastian, Matthias. Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation. The Decoder. 2024-11-06 [2024-11-17] (美国英语). 
  32. ^ Introducing FLUX1.1 [pro] Ultra and Raw Modes. Black Forest Labs. 2024-11-06 [2024-11-17]. (原始内容存档于12 November 2024) (美国英语). 
  33. ^ 33.0 33.1 Edwards, Benj. FLUX: This new AI image generator is eerily good at creating human hands. Ars Technica. 2024-08-02 [2024-11-17] (美国英语). 
  34. ^ Zeff, Maxwell. Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator. TechCrunch. 2024-08-14 [2024-11-17]. (原始内容存档于17 November 2024) (美国英语). 
  35. ^ Schwarzer, Matthias. Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik. RND.de. 2024-08-16 [2024-11-17] (德语). 
  36. ^ Künne, Christoph. FLUX.1: Neuer KI-Bildgenerator. DOCMA. 2024-08-07 [2024-11-17]. (原始内容存档于31 August 2024) (德语). 
  37. ^ Black Forest Labs on Hugging Face. Hugging Face. [2025-01-05]. (原始内容存档于2 February 2025). 
  38. ^ Flux Collection on Replicate. Replicate. [2025-01-05]. (原始内容存档于25 January 2025). 

外部链接

[编辑]