跳至內容

Flux

維基百科,自由的百科全書
Flux
AI 生成的數位圖像,主題為通往森林的小徑,背景為山脈
由 Flux 1.1 Pro(Ultra 模式)生成的圖像。提示詞:請生成一張你覺得能代表你自己的圖像。
原作者黑森林實驗室(英語:Black Forest Labs
開發者黑森林實驗室
首次發布2024年8月
當前版本Flux 1.1 Pro(模型)[1](2024 年 10 月 2 日)
源代碼庫 編輯維基數據鏈接
類型文字轉圖像模型
許可協議Apache License(Schnell版本)、非商業授權(Dev版本)、專有授權(Pro版本)
網站blackforestlabs.ai

Flux(亦稱FLUX.1)是由總部位於德國弗賴堡的黑森林實驗室(英語:Black Forest Labs)所開發的文字轉圖像模型。該公司由多位前Stability AI員工創辦。與其他同類型模型相同,Flux能夠根據自然語言輸入(即提示詞)生成圖像。

歷史

[編輯]

黑森林實驗室於2024年成立,創辦人為Stability AI前員工羅賓・隆巴赫(英語:Robin Rombach)、安德烈亞斯・布拉特曼(英語:Andreas Blattmann)和帕特里克・埃塞爾(英語:Patrick Esser)。[2][3]他們早年在德國慕尼黑大學(英語:Ludwig Maximilian University of Munich)擔任Björn Ommer的研究助理,專門研究人工智慧圖像生成技術。[4][5][6]2022 年,他們發表了相關研究成果,並促成了Stable Diffusion的誕生。[6][7]

黑森林實驗室的投資者包括創投公司Andreessen Horowitz,以及Brendan Iribe英語Brendan IribeMichael Ovitz英語Michael OvitzGarry Tan英語Garry TanVladlen Koltun英語Vladlen Koltun[8]在創立初期,公司獲得3100萬美元的投資。[9][10]

2024年8月,Flux被整合進由xAI開發的聊天機器人Grok,並作為 X(前推特)付費功能的一部分提供。[11][12][13][14]Grok於同年12月改用自家開發的文字轉圖像模型Aurora[15]

2024年11月18日,Mistral AI宣布,其聊天機器人Le Chat已整合Flux Pro作為圖像生成模型。[16][17]

2024年11月21日,黑森林實驗室宣布推出圖像編輯工具Flux.1 Tools,可搭配現有Flux模型使用,這套工具包括:

  • Flux.1 Fill(用於補圖與延伸圖像邊緣,即Inpainting英語Inpainting/outpainting);
  • Flux.1 Depth(依據輸入圖像的深度圖英語depth map與提示詞進行控制生成);
  • Flux.1 Canny(依據輸入圖像的邊緣線條進行控制生成);
  • Flux.1 Redux(將不同輸入圖像與提示詞混合生成新圖像)。

這些工具皆提供Dev(開發者)版與Pro(專業)版兩種選擇。[18][19]

2025 年 1 月,黑森林實驗室宣布與輝達合作,將Flux模型納入其Blackwall微架構的基礎模型。[20]同時,該公司推出Flux Pro微調API,供使用者自訂與微調圖像英語Fine-tuning (deep learning)生成內容,並與德國媒體公司 Hubert Burda Media英語Hubert Burda Media合作,將 Flux Pro 應用於內容製作。[21]

模型

[編輯]

Flux是一系列基於修正型流式轉換器(英語:rectified flow transformer)架構開發的文字轉圖像模型,參數規模達120億。[8][22]

根據不同版本,Flux提供三種授權模式:

使用者可以在線上或本機透過介面如ComfyUI英語ComfyUIStable Diffusion WebUI Forge英語Stable Diffusion WebUI Forge(Automatic1111 WebUI 的改良版英語Fork (software development))來使用這些模型。[8][27]

改良後的旗艦模型Flux 1.1 Pro於2024年10月2日推出。[28][29]2024年11月6日,新增兩種進階模式:

此外,Flux團隊正在開發的文字轉影片模型SOTA,原預計於2024年底推出。[8]

評價

[編輯]

根據《Ars Technica》的測試,Flux.1 Dev與Pro模型在提示詞還原度方面可與DALL-E 3匹敵,而圖像寫實程度則接近Midjourney 6。相較於 Stable Diffusion XL,Flux對人手的細節呈現更為穩定。[33]

爭議

[編輯]

有批評指出Flux生成圖像過於寫實。媒體報導指出,其生成內容涵蓋從川普持槍的圖像,到令人不安的場景,引發外界對其倫理與濫用風險的爭議。[4][13]

模型推出後,X (前推特)出現大量由Flux所生成的圖像,黑森林實驗室並未透露其訓練資料的具體來源。[34][35][30]《Ars Technica》懷疑Flux是在未經授權的情況下,從網路上大量蒐集圖像英語Web scraping所訓練而成,此作法在法律層面存在爭議。[33][36]

第三方整合

[編輯]

雖然黑森林實驗室未在其官方網站提供直接存取模型的方式,但Flux模型已在多個第三方平台上廣泛提供,供創作者與專業人士使用,包括Hugging Face[37]和Replicate[38]等平台。

參考資料

[編輯]
  1. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  2. ^ Killian, Nicolas. Black Forest Labs: Sie sind ein Teil von jener Kraft需要付費訂閱. Die Zeit. 2024-08-27 [2024-11-17]. ISSN 0044-2070. (原始內容存檔於4 October 2024) (de-DE). 
  3. ^ Growcoot, Matt. AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E. PetaPixel. 2024-08-05 [2024-11-17] (英語). 
  4. ^ 4.0 4.1 Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…. AlleAktien. 2024-08-22 [2024-11-17] (德語). 
  5. ^ Hermes, Ann Kathrin. Black Forest Labs: KI-Tools aus dem Schwarzwald. trend.at. 2024-08-08 [2024-11-17] (德語). 
  6. ^ 6.0 6.1 Schwär, Hannah. Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt. Capital.de. 2024-08-15 [2024-11-17] (德語). 
  7. ^ High-Resolution Image Synthesis with Latent Diffusion Models. Computer Vision & Learning Group. [2024-11-17]. (原始內容存檔於16 November 2024) (美國英語). 
  8. ^ 8.0 8.1 8.2 8.3 Announcing Black Forest Labs. Black Forest Labs. 2024-08-01 [2024-11-17]. (原始內容存檔於17 November 2024) (美國英語). 
  9. ^ Steinschaden, Jakob. Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney. Trending Topics. 2024-08-12 [2024-11-17]. (原始內容存檔於28 August 2024) (德語). 
  10. ^ Nuñez, Michael. Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator. VentureBeat. 2024-08-01 [2024-11-17]. (原始內容存檔於8 October 2024) (美國英語). 
  11. ^ Puscher, Frank. Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen需要付費訂閱. MEEDIA. [2024-11-17]. (原始內容存檔於27 September 2024) (德語). 
  12. ^ Bomke, Luisa. Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei. Handelsblatt. [2024-11-17]. (原始內容存檔於30 August 2024) (德語). 
  13. ^ 13.0 13.1 Weatherbed, Jess. xAI's new Grok-2 chatbots bring AI image generation to X. The Verge. 2024-08-14 [2024-11-17]. (原始內容存檔於17 November 2024) (英語). 
  14. ^ Metz, Rachel. This Tiny Startup Is Helping Musk's Grok With Image Generation需要付費訂閱. Bloomberg News. 2024-08-21 [2024-11-19] (英語). 
  15. ^ Davis, Wes. X gives Grok a new photorealistic AI image generator. The Verge. 2024-12-07 [2024-12-10]. (原始內容存檔於12 December 2024) (英語). 
  16. ^ Mistral has entered the chat. Mistral AI. 2024-11-18 [2024-12-11] (美國英語). 
  17. ^ Franzen, Carl. Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor. VentureBeat. 2024-11-18 [2024-12-11] (美國英語). 
  18. ^ Introducing FLUX.1 Tools. Black Forest Labs. 2024-11-21 [2024-12-13]. (原始內容存檔於26 November 2024) (美國英語). 
  19. ^ Bastian, Matthias. Black Forest Labs expands FLUX.1 with four new AI tools for image editing. The Decoder. 2024-11-22 [2024-12-15]. (原始內容存檔於22 November 2024) (美國英語). 
  20. ^ Takahashi, Dean. Nvidia unveils AI foundation models running on RTX AI PCs. VentureBeat. 2025-01-07 [2025-01-19]. (原始內容存檔於9 January 2025) (美國英語). 
  21. ^ Franzen, Carl. You can now fine-tune your own version of AI image maker Flux with just 5 images. VentureBeat. 2025-01-16 [2025-01-19]. (原始內容存檔於24 January 2025) (美國英語). 
  22. ^ black-forest-labs/FLUX.1-dev · Hugging Face. Hugging Face. 2025-04-19 [2025-04-19] (美國英語). 
  23. ^ Get Flux. Black Forest Labs. [2024-11-17]. (原始內容存檔於16 November 2024) (美國英語). 
  24. ^ Wiggers, Kyle. Black Forest Labs, the startup behind Grok's image generator, releases an API. TechCrunch. 2024-10-03 [2024-11-17]. (原始內容存檔於4 October 2024) (美國英語). 
  25. ^ flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux. GitHub. [2024-11-18]. (原始內容存檔於15 September 2024) (英語). Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model. 
  26. ^ API Agreement - BFL Docs (Pro). Black Forest Labs. 2024-08-01 [2024-11-18]. (原始內容存檔於3 October 2024). Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. 
  27. ^ 田口和裕. 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6). ASCII.jp. ASCII Media Works. 18 August 2024 [21 November 2024] (日語). 
  28. ^ Announcing FLUX1.1 [pro] and the BFL API. Black Forest Labs. 2 October 2024 [2024-11-17]. 
  29. ^ Franzen, Carl. Black Forest Labs releases Flux 1.1 Pro and an API. VentureBeat. 2024-10-03 [2024-11-17] (美國英語). 
  30. ^ 30.0 30.1 Growcoot, Matt. Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography'. PetaPixel. 2024-11-07 [2024-11-19] (英語). 
  31. ^ Bastian, Matthias. Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation. The Decoder. 2024-11-06 [2024-11-17] (美國英語). 
  32. ^ Introducing FLUX1.1 [pro] Ultra and Raw Modes. Black Forest Labs. 2024-11-06 [2024-11-17]. (原始內容存檔於12 November 2024) (美國英語). 
  33. ^ 33.0 33.1 Edwards, Benj. FLUX: This new AI image generator is eerily good at creating human hands. Ars Technica. 2024-08-02 [2024-11-17] (美國英語). 
  34. ^ Zeff, Maxwell. Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator. TechCrunch. 2024-08-14 [2024-11-17]. (原始內容存檔於17 November 2024) (美國英語). 
  35. ^ Schwarzer, Matthias. Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik. RND.de. 2024-08-16 [2024-11-17] (德語). 
  36. ^ Künne, Christoph. FLUX.1: Neuer KI-Bildgenerator. DOCMA. 2024-08-07 [2024-11-17]. (原始內容存檔於31 August 2024) (德語). 
  37. ^ Black Forest Labs on Hugging Face. Hugging Face. [2025-01-05]. (原始內容存檔於2 February 2025). 
  38. ^ Flux Collection on Replicate. Replicate. [2025-01-05]. (原始內容存檔於25 January 2025). 

外部連結

[編輯]