跳转到内容

Flux

维基百科,自由的百科全书
Flux
AI 生成的數位圖像,主題為通往森林的小徑,背景為山脈
由 Flux 1.1 Pro(Ultra 模式)生成的圖像。提示詞:「請生成一張你覺得能代表你自己的圖像」,出自 Black Forest Labs。
原作者黑森林實驗室(英語:Black Forest Labs
開發者黑森林實驗室
首次发布2024年8月
当前版本Flux 1.1 Pro(模型)[1](2024 年 10 月 2 日)
源代码库 編輯維基數據鏈接
类型文字轉圖像模型
许可协议Apache License(Schnell 版本)、非商業授權(Dev 版本)、專有授權(Pro 版本)
网站blackforestlabs.ai

Flux(亦稱 FLUX.1)是由總部位於德國弗賴堡的黑森林實驗室(英語:Black Forest Labs)所開發的文字轉圖像模型。該公司由多位前Stability AI員工創辦。與其他同類型模型相同,Flux 能夠根據自然語言輸入(即提示詞)生成圖像。

歷史

[编辑]

黑森林實驗室於2024年成立,創辦人為Stability AI前員工羅賓·隆巴赫(英語:Robin Rombach)、安德烈亞斯·布拉特曼(英語:Andreas Blattmann)和帕特里克·埃塞爾(英語:Patrick Esser)。[2][3]他們早年在德國慕尼黑大學(英語:Ludwig Maximilian University of Munich)擔任 Björn Ommer 的研究助理,專門研究人工智慧圖像生成技術。[4][5][6]2022 年,他們發表了相關研究成果,並促成了Stable Diffusion的誕生。[6][7]

黑森林實驗室的投資者包括創投公司Andreessen Horowitz,以及Brendan Iribe英语Brendan IribeMichael Ovitz英语Michael OvitzGarry Tan英语Garry TanVladlen Koltun英语Vladlen Koltun[8]在創立初期獲得3100萬美元的投資。[9][10]

2024年8月,Flux被整合進由xAI開發的聊天機器人Grok,並作為 X(前推特)付費功能的一部分提供。[11][12][13][14]Grok於同年12月改用自家開發的文字轉圖像模型Aurora[15]

2024年11月18日,Mistral AI宣布,其聊天機器人 Le Chat 已整合 Flux Pro 作為圖像生成模型。[16][17]

2024年11月21日,黑森林實驗室宣布推出圖像編輯工具Flux.1 Tools,可搭配現有 Flux 模型使用,這套工具包括:

  • Flux.1 Fill:(用於補圖與延伸圖像邊緣(Inpainting英语Inpainting/Outpainting))
  • Flux.1 Depth(依據輸入圖像的深度圖英语depth map與提示詞進行控制生成)
  • Flux.1 Canny(依據輸入圖像的邊緣線條進行控制生成)
  • Flux.1 Redux(將不同輸入圖像與提示詞混合生成新圖像)

這些工具皆提供 Dev(開發者)版與 Pro(專業)版兩種選擇。[18][19]

2025 年 1 月,黑森林實驗室宣布與輝達合作,將 Flux 模型納入其Blackwell (微架构)微架構的基礎模型。[20]同時,該公司推出 Flux Pro 微調 API,供使用者自訂與微調圖像英语Fine-tuning (deep learning)生成內容,並與德國媒體公司 Hubert Burda Media英语Hubert Burda Media合作,將 Flux Pro 應用於內容製作。[21]

模型

[编辑]

Flux 是一系列基於修正型流式轉換器(英語:rectified flow transformer)架構開發的文字轉圖像模型,參數規模達 120 億。[8][22]

根據不同版本,Flux 提供三種授權模式:

使用者可以在線上或本機透過介面如ComfyUI英语ComfyUIStable Diffusion WebUI Forge英语Stable Diffusion WebUI Forge(Automatic1111 WebUI 的改良版英语Fork (software development))來使用這些模型。[8][27]

改良後的旗艦模型Flux 1.1 Pro於2024年10月2日推出。[28][29]2024年11月6日,新增兩種進階模式:

此外,Flux 團隊正在開發的文字轉影片模型SOTA,原預計於2024年底推出。[8]

評價

[编辑]

根據《Ars Technica》的測試,Flux.1 Dev與Pro模型在提示詞還原度方面可與DALL-E 3匹敵,而圖像寫實程度則接近Midjourney 6。相較於 Stable Diffusion XL,Flux對人手的細節呈現更為穩定。[33]

有批評指出Flux生成圖像過於寫實。媒體報導指出,其生成內容涵蓋從川普持槍的圖像到令人不安的場景,導致外界對該技術的倫理與濫用風險的爭議。[4][13]

模型推出後,X(前推特)出現大量由Flux所生成的圖像,黑森林實驗室並未透露其訓練資料的具體來源。[34][35][30]《Ars Technica》懷疑Flux是在未經授權的情況下,從網路上大量蒐集圖像英语Web scraping所訓練而成,此作法在法律層面存在爭議。[33][36]

第三方整合

[编辑]

雖然黑森林實驗室未在其官方網站提供直接存取模型的方式,但Flux模型已在多個第三方平台上廣泛提供,供創作者與專業人士使用,包括Hugging Face[37]和Replicate[38]等平台。

參考資料

[编辑]
  1. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  2. ^ Killian, Nicolas. Black Forest Labs: Sie sind ein Teil von jener Kraft需要付费订阅. Die Zeit. 2024-08-27 [2024-11-17]. ISSN 0044-2070. (原始内容存档于4 October 2024) (de-DE). 
  3. ^ Growcoot, Matt. AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E. PetaPixel. 2024-08-05 [2024-11-17] (英语). 
  4. ^ 4.0 4.1 Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…. AlleAktien. 2024-08-22 [2024-11-17] (德语). 
  5. ^ Hermes, Ann Kathrin. Black Forest Labs: KI-Tools aus dem Schwarzwald. trend.at. 2024-08-08 [2024-11-17] (德语). 
  6. ^ 6.0 6.1 Schwär, Hannah. Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt. Capital.de. 2024-08-15 [2024-11-17] (德语). 
  7. ^ High-Resolution Image Synthesis with Latent Diffusion Models. Computer Vision & Learning Group. [2024-11-17]. (原始内容存档于16 November 2024) (美国英语). 
  8. ^ 8.0 8.1 8.2 8.3 Announcing Black Forest Labs. Black Forest Labs. 2024-08-01 [2024-11-17]. (原始内容存档于17 November 2024) (美国英语). 
  9. ^ Steinschaden, Jakob. Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney. Trending Topics. 2024-08-12 [2024-11-17]. (原始内容存档于28 August 2024) (德语). 
  10. ^ Nuñez, Michael. Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator. VentureBeat. 2024-08-01 [2024-11-17]. (原始内容存档于8 October 2024) (美国英语). 
  11. ^ Puscher, Frank. Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen需要付费订阅. MEEDIA. [2024-11-17]. (原始内容存档于27 September 2024) (德语). 
  12. ^ Bomke, Luisa. Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei. Handelsblatt. [2024-11-17]. (原始内容存档于30 August 2024) (德语). 
  13. ^ 13.0 13.1 Weatherbed, Jess. xAI's new Grok-2 chatbots bring AI image generation to X. The Verge. 2024-08-14 [2024-11-17]. (原始内容存档于17 November 2024) (英语). 
  14. ^ Metz, Rachel. This Tiny Startup Is Helping Musk's Grok With Image Generation需要付费订阅. Bloomberg News. 2024-08-21 [2024-11-19] (英语). 
  15. ^ Davis, Wes. X gives Grok a new photorealistic AI image generator. The Verge. 2024-12-07 [2024-12-10]. (原始内容存档于12 December 2024) (英语). 
  16. ^ Mistral has entered the chat. Mistral AI. 2024-11-18 [2024-12-11] (美国英语). 
  17. ^ Franzen, Carl. Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor. VentureBeat. 2024-11-18 [2024-12-11] (美国英语). 
  18. ^ Introducing FLUX.1 Tools. Black Forest Labs. 2024-11-21 [2024-12-13]. (原始内容存档于26 November 2024) (美国英语). 
  19. ^ Bastian, Matthias. Black Forest Labs expands FLUX.1 with four new AI tools for image editing. The Decoder. 2024-11-22 [2024-12-15]. (原始内容存档于22 November 2024) (美国英语). 
  20. ^ Takahashi, Dean. Nvidia unveils AI foundation models running on RTX AI PCs. VentureBeat. 2025-01-07 [2025-01-19]. (原始内容存档于9 January 2025) (美国英语). 
  21. ^ Franzen, Carl. You can now fine-tune your own version of AI image maker Flux with just 5 images. VentureBeat. 2025-01-16 [2025-01-19]. (原始内容存档于24 January 2025) (美国英语). 
  22. ^ black-forest-labs/FLUX.1-dev · Hugging Face. Hugging Face. 2025-04-19 [2025-04-19] (美国英语). 
  23. ^ Get Flux. Black Forest Labs. [2024-11-17]. (原始内容存档于16 November 2024) (美国英语). 
  24. ^ Wiggers, Kyle. Black Forest Labs, the startup behind Grok's image generator, releases an API. TechCrunch. 2024-10-03 [2024-11-17]. (原始内容存档于4 October 2024) (美国英语). 
  25. ^ flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux. GitHub. [2024-11-18]. (原始内容存档于15 September 2024) (英语). Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model. 
  26. ^ API Agreement - BFL Docs (Pro). Black Forest Labs. 2024-08-01 [2024-11-18]. (原始内容存档于3 October 2024). Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. 
  27. ^ 田口和裕. 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6). ASCII.jp. ASCII Media Works. 18 August 2024 [21 November 2024] (日语). 
  28. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  29. ^ Franzen, Carl. Black Forest Labs releases Flux 1.1 Pro and an API. VentureBeat. 2024-10-03 [2024-11-17] (美国英语). 
  30. ^ 30.0 30.1 Growcoot, Matt. Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography'. PetaPixel. 2024-11-07 [2024-11-19] (英语). 
  31. ^ Bastian, Matthias. Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation. The Decoder. 2024-11-06 [2024-11-17] (美国英语). 
  32. ^ Introducing FLUX1.1 [pro] Ultra and Raw Modes. Black Forest Labs. 2024-11-06 [2024-11-17]. (原始内容存档于12 November 2024) (美国英语). 
  33. ^ 33.0 33.1 Edwards, Benj. FLUX: This new AI image generator is eerily good at creating human hands. Ars Technica. 2024-08-02 [2024-11-17] (美国英语). 
  34. ^ Zeff, Maxwell. Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator. TechCrunch. 2024-08-14 [2024-11-17]. (原始内容存档于17 November 2024) (美国英语). 
  35. ^ Schwarzer, Matthias. Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik. RND.de. 2024-08-16 [2024-11-17] (德语). 
  36. ^ Künne, Christoph. FLUX.1: Neuer KI-Bildgenerator. DOCMA. 2024-08-07 [2024-11-17]. (原始内容存档于31 August 2024) (德语). 
  37. ^ Black Forest Labs on Hugging Face. Hugging Face. [2025-01-05]. (原始内容存档于2 February 2025). 
  38. ^ Flux Collection on Replicate. Replicate. [2025-01-05]. (原始内容存档于25 January 2025). 

外部連結

[编辑]