AI 算圖新選擇 Flux.1 本地+線上+平替

你風哥 WindBro

發佈於你風哥的生成AI八門秘笈

更新於 2024/09/08發佈於 2024/09/05閱讀時間約 17 分鐘

是不是你以前下載的那些模型，現在都可以丟掉了？🙂

又到了插播新聞的時候啦。

八月份出現了一個討論度非常高的新玩具，由幾位前 Stability AI 團隊成員所成立的新公司 Black Forest Labs.，發布了全新系列模型—— Flux.1。^{（點名字進 BFL 首頁）}

今天我們來一起看看，Flux 這個新玩具到底有什麼特別的。

如果你還沒有聽過 Flux（雖然我覺得不太可能🤔）或者還不太確定它到底是什麼，那麼等一下我會從頭來介紹它。

如果你對它已經有了一個基本的理解，我的文章都有分段章節，你可以往下拉，去看看要怎麼上手使用。

這次主要是給 Flux 一個 once-over，講得會簡單一點，如果你對我的內容感興趣，歡迎點讚訂閱 YT 頻道開啟小鈴鐺，加入我的 Vocus 沙龍，下次有新文章就不會錯過了。

Flux.1 是誰做的？

剛剛提到過，推出 Flux.1 系列模型的 Black Forest Labs 團隊裡面，大多數成員都是來自 Stability AI，這間公司就是我們熟知的開發了 Stable Diffusion 系列模型的公司，而 Black Forest Labs 的核心成員，就是當初開發了 SD 1.5、SDXL、以及 SD3 的主要團隊成員。

有在關注的人應該知道，在 SD3 公布之後沒多久，也就是前陣子吧，Stability 有蠻多團隊成員出走，Black Forest Labs 的成員應該也就是在那時候離開了 Stability AI。

所以，有一個說法是這樣的，你可以聽聽看，現在呈現在我們眼前的 Flux.1 很有可能就是一個 SD3 的變體。

他們這次一口氣推出了 Flux.1 [pro]、Flux.1 [dev]、Flux.1 [schnell] 三個模型。

[pro] 是具備最強能力的完整版，但它目前沒有開源。
[dev] 是從 [pro] 蒸餾出來的模型，它不能商用，但是是開源的。
[schnell] 則是可以商用的高速模型，同樣從 [pro] 蒸餾出來，schnell 這個詞的意思就是快速。

按照開發團隊所說的：

"hybrid architecture of multimodal and parallel diffusion transformer blocks and scaled to 12B parameters"

它是一個混合架構的多模態、平行 DiT (diffusion transformer) 算法、並且有著十二億參數的模型。
用人類的語言來講，就是結合了目前最好的算法和技術來架構出的，同時具備了高理解和高品質能力的圖像生成模型。

再說得簡單一點，就是這個模型超屌。

那屌不屌我說了也不算，有時候光看數據也不算，還是要你自己感受過後再來評斷，它是不是你理想的模型。這個後面說哈。
現在我們先繼續來看，它的開發團隊是怎麼介紹它的。

在它的展示頁面，可以看到 Flux 在不同風格上的生成結果，點開除了能查看圖像細節，還可以看到他們是用什麼樣的提示詞生成的。

圖片來源 : Flux.1 官方展示

寫實效果是真的相當可怕，像這樣的圖，乍一看 AI 感確實是挺低了，已經開始脫離所謂一眼 AI 的狀態。

圖片來源 : Flux.1 官方展示

對插畫和奇幻類型的掌握也稱得上不錯了，細節足夠，展現出很好的提示詞服從，但畫風就……偏普吧。

不過 Civitai 上有很多以 Flux 做為基底訓練的 LoRA，目前對應的 ControlNet 也在逐步開發釋出，所以實用上，畫風這點並不難彌補。未來也可以期待由 Flux 作為底模所訓練的大模型。

開發團隊表示，Flux 系列模型呢，在圖像的細節、複雜度和風格多樣性上都定義了全新的技術高度，並且同時有著非常高的提示一致性，也就是它非常能夠按照你給的提示詞來構成畫面。

你說左邊就左邊，你說右邊就右邊。

從展示頁面的範例就能看得出來，在提示詞這方面，誠如開發團隊所聲稱的，是有很高還原度或說忠誠度的。

以前我常會跟人說，寫 prompt 的時候不要用敘述的方式去寫，你跟 AI 說這個人和另一個人，或者左邊是什麼右邊是什麼，是沒有意義的。
因為對 AI 來說它根本就聽不懂，也分不出來區別。

但是，圖像模型發展到了這裡，確實必須承認，現在它聽得懂了。
就算不能說對自然語言的理解達到 100%，說有個 6-70% 也不過份。
剩下這 30% 不單只是理解語言的問題，還有模型本身的資料量受限的部分。所以 Flux 已經算是表現得最好的模型了。

評分表現

這是開發團隊提供的評分比較量表，可以看到 Flux.1 的表現已經遠遠的超過我們現在普遍應用的 SDXL 系列了，比 DALL-E 3 和 Midjourney V6 也強了不少。看上去非常驚人對吧。

下面這張圖又更詳細的分類了五項能力值，左邊是包含了跟剛剛那張一樣的競品，右邊是 Flux [schnell] 和 SD3、SDXL-Lightning 之間的對比。

可以看到在評分上 Flux [pro] 幾乎是全方位屌打其他家，只在文字排版能力上，略為輸給系出 Google Brain 的 Ideogram。

Ideogram

Prompt :
a web design draft for a cozy coffee shop that features a homepage with a hero section titled "Welcome to Brew Haven" and the subtitle "Where Every Cup Tells a Story," set against a full-width image slider showcasing the café's ambiance, artisan coffee, and pastries. Include a "Discover Our Menu" call-to-action button. Add an "About Us" section detailing the café's story and passion for coffee, highlights of specialty brews and signature pastries, customer testimonials, and a section for latest events and special offers.

不得不說 Ideogram 2.0 的文字排版表現力是真的很可怕，如果你是設計師，平常工作內容是關於平面廣告、網頁設計這類型的，真的可以考慮去試用看看 Ideogram。

🎉 GoingBus 串流媒體合租平台 🎉

用 AI 輔助工作，省下來的時間當然要用來看片爽爽！
和世界各地的用戶一起分攤訂閱費，用最低價格享受 Netflix、Disney+ 等熱門串流服務，還有 GPT-4！立即訂閱 GoingBus，輕鬆合租，一起省錢！

✨首購輸入優惠碼：windbro，再享九折優惠！✨

GoingBus首頁：https://goingbus.com?s=Huk4FaoU

基本的介紹到這邊差不多了，接下來，建議你手邊要有電腦，跟我一起來看看這個 Flux 要怎麼上手使用吧。

怎麼用到 Flux.1

除了可以本地安裝之外，也有線上免費的體驗版本。

目前 Flux 已經有大神製作了更輕量的 fp8 版本，如果你的電腦記憶體 (RAM) 超過 24GB，可以下載完整版的 Flux [dev] 或 [schnell]，如果沒有的話，可以選擇下載 fp8 的版本。實際上的生成品質降低並不多，但資源消耗差了一半。

以下 Black Forest Lab 發布的原版簡稱完整版，fp8 版本簡稱輕量版。

NF4 超輕量版

📢剪片的時候，已經有大神製作了更小的超輕量版 NF4 版本 Flux.1，適合 RAM 和 VRAM 都很小的朋友，也許我的電腦也跑得動，不過這個只能下次再嘗試了。

📢NF4 版的模型下載位置【here】。

基本上，其實我的電腦是跑不動的🥲，大多數一般中上的電腦配置，跑一張圖也會要非常久，但我還是會帶各位硬體設備足夠好的朋友，看一下怎麼進行本地配置。

確認好你自己的設備環境之後，就可以開始下載必要的模型。

直接從 Comfy 提供的 Flux 範例說明頁面，就可以找到下載安裝的指示以及連結，你可以先點開上面這個頁面，然後跟著我一步一步來進行安裝。

安裝必要模型

首先你需要下載對應的 Clip 和 vae。（使用完整版才需要下載）

如果你的記憶體 (RAM) 夠大，超過 32GB，可以下載 fp16 版本的 Clip。
那如果你是大於 24GB 但沒有超過 32GB 的話，可以下載 fp8 版本的 Clip。

和這個 Clip_l，這個是一定要載的。

把 Clip 放到 Comfy 的 models/clip/ 資料夾裡面，這個位置是沒有寫在 model_path 文件裡面的，所以要直接放進去 Comfy 自己的資料夾。

vae 的話就放 vae 資料夾，如果你導過路徑，就放去對應的位置裡面。

接下來你如果要下載完整版模型，[dev] 和 [schnell] 點這個 here 會連到 Black Forest Labs 的對應 HuggingFace 下載位置，download 到——注意，Flux 的完整版模型，需要放到 models/unet 資料夾裡面。

往下滾一點就會找到輕量版的下載網址，同樣是點 here，但輕量版就是放到你平常放大模型的位置。

順便，把這兩張圖片載下來，裡面包含了 Comfy 為你提供的範例 workflow。

務必更新 ComfyUI

在等待下載的同時，請各位過去已經安裝好了 Comfy，但最近都沒有更新過的朋友，先去更新一下你的 ComfyUI。

一般 git clone 安裝的人，一樣 cmd 叫出來 git pull 一下就可以。
使用打包版本的可以重新下載一次，或是點 update_comfyui_and_python_dependencies.bat 這個檔案，跑一下更新。

好久以前截的圖，總之你找一下

不推薦使用 Manager 的 update 按鈕來更新，有機率會更新不完全。

最近 Comfy 的前端，也就是我們平常使用的介面，有了一些風格上的改動，最明顯的是以往我們使用的搜尋框，還有 Manager 的 node list。
下次再單獨來說一下這些改動部分。

目前 Flux 的完整版，需要使用獨立的特殊節點來生成，直接拖範例圖片讀取工作流程，就會給你全部擺好。

完整版 Schnell workflow.png

如果你想自己架構的話，這些 node 分散在很多不一樣的地方，你可以透過新版搜尋框，來找到他們各自在 add node 選單裡面的位置，我這邊就不一個一個展開來講了。

輕量版在 comfy 提供的範例裡面，使用的是 (類似於) default 工作流程，如果你想用完整版的流程來跑輕量版，當然也可以，但你的輕量版模型就必須要放到 models/unet 資料夾，不然它這個方塊是讀不到的。

免費線上試用

那今天如果你的電腦，跟我一樣跑不動本地安裝的任何版本，Flux 在 HuggingFace 上有基礎的試用空間，人多的時候可能會很慢，但這邊沒有限制額度的問題。

也有跟兩家線上 AI 算圖平台合作推出了試用，一個是 Replicate 一個是 fal.ai，出圖的速度非常快，只是這兩個平台都屬於額度並不高的免費試用。

最近又新增了一些其他試用平台，你可以從 Black Forest Lads 首頁往下拉，在每個模型旁邊找到各種不同試用平台的連結。

其中有兩個沒有顯示在上面，一個叫 xAI，就是推特旗下的聊天 AI。
另一個是之前我們有介紹過的 KREA.ai，KREA 每天都有少量的免費額度，不過目前看起來只有提供 [schnell] 模型。

平替版 Flux？

最後，還有一個可以說是平替版的存在，也是我這個頻道上主要介紹的另一家 AI 圖像生成平台，Leonardo.Ai 上最新的 Phoenix 模型。

我有稍微跑了幾輪測試對比，展示給各位參考一下。

Art nouveau style illustration featuring a mystical female figure with flowing, intricate details. The layout is vertical, with the subject centered. The woman has long, wavy hair adorned with flowers, and her skin is a pale blue-green hue. She wears an elaborate, flowing dress with organic, wave-like patterns in shades of blue and green. Her facial features are delicate, with a serene expression. The background is a stained glass window with ornate, swirling designs in warm tones of orange, yellow, and red. There are two glowing lanterns at the bottom corners of the image. Text at the bottom is in a stylized, decorative font, with the letters in gold against a dark background.
新藝術風格的插圖，描繪了神秘的女性形象，細節流暢、複雜。佈局是垂直的，主題居中。這個女人有一頭長長的捲髮，上面裝飾著花朵，她的皮膚是淡藍綠色的。她穿著一件精緻、飄逸的連身裙，上面有藍色和綠色色調的有機波浪狀圖案。她的五官精緻，表情安詳。背景是一扇彩色玻璃窗，上面有華麗的漩渦圖案，採用橙色、黃色和紅色的暖色調。影像的底角有兩個發光的燈籠。底部的文字採用風格化的裝飾字體，深色背景上的字母為金色。
A giant just layers of cheese and buns, placed inside a black and gold dollhouse, mini furniture
一個巨大的起司和麵包，放置在黑色和金色的玩具屋內，還有迷你家具
Fantasy creature with the upper body of a tiger but the lower body of a fish tail fin, swimming in the sea of stars, very scary and beautiful, with wings, creative children's clay style
上半身是老虎下半身是魚尾鰭的奇幻生物，在星辰大海中游泳，非常恐怖又美麗，長著翅膀，創意兒童黏土風格
There is a snow leopard on the left with its bow drawn, and on the right there is a white bear wearing a glowing hat. In the background is a group of hyper-realistic clocks jogging, realistic retro photography style long exposure dynamic shot
左邊是一隻拉著弓的雪豹，右邊是一隻戴著發光帽子的白熊。背景是一群超寫實的時鐘慢跑，寫實復古攝影風格長曝光動態拍攝

事實證明，弓箭果然還是很難靠純 prompt 生成🤪

這是他們自己開發訓練的模型，同樣對提示詞有著高度理解和忠誠能力，還能夠在生成後繼續對提示詞作敘述性的微調。
如果你不知道 Leonardo.Ai 是什麼，我的沙龍裡面有一些 Leo 的教學，免費用戶每天都有 150 的生圖代幣，在官方 DC 參與挑戰比賽，還有機會拿到更多免費代幣。

目前也有支持全中文操作環境的中國版 Leo，相關影片你可以在我 B 站的同名頻道裡找到。中國版 Leo 同樣每天有免費的 150 代幣，以及可以贏得額外 1000 代幣的主題挑戰。

結語

整體看下來我會說 Flux 確實是很強，特別是在把文字放進畫面這件事情上，可以說是目前做得最穩定的。雖然我還是不太習慣用敘述句來寫 prompt，但使用自然語言提示詞這件事，目前確實逐漸在成為主流。

看完這篇文章之後，你覺得 Flux.1 這個新玩具怎麼樣？

它會打敗目前市佔率第一的 SD 系列模型，成為之後各大模型製作者愛用的底模嗎？

它真的有比 MJv6 的效果更好嗎？

歡迎在底下留言告訴我你的想法，把文章分享給你對 AI 算圖感興趣的朋友吧！

感謝各位收看，我們下次見，掰掰。

你風哥的 AI 分享好讀版你風哥的生成AI八門秘笈AI工具

留言

留言分享你的想法！

你風哥的 AI 分享好讀版

62會員

29內容數

Youtube頻道［你風哥 Wind Bro Draw］上各式生成AI工具教學及介紹影片的文字版，包含使用方法與小技巧，完整的影片文案重新梳理，或是實用小筆記，還有進階使用者的理論基礎部分。工具目前包含ComfyUI、Leonardo.Ai、Picsi.Ai、Pika Labs……等，緩慢新增中。

你風哥的 AI 分享好讀版的其他內容

2024/03/18

簡單解釋 SORA 工作原理

關於 SORA 技術原理的圖像式解說，內容從通用型人工智慧到生成運算的原理以及相關的技術研究成果。提供了使用生成運算方式的 Diffusion Transformer 介紹和進階閱讀的指路。分享 AI 研究領域的開放性和合作精神，以及對視覺產業可能帶來的影響。

2024/03/18

簡單解釋 SORA 工作原理

2023/12/15

KREA AI新手指南

介紹免安裝、網頁操作的即時生成AI繪圖工具——KREA AI，從申請到使用一次看完。

2023/12/15

KREA AI新手指南

介紹免安裝、網頁操作的即時生成AI繪圖工具——KREA AI，從申請到使用一次看完。

2023/10/30

Picsi.Ai新手指南+語法表

分享一個在discord上使用的換臉機器人，跟SDwebui上的Roop一樣屬於AI換臉工具，這款是在DC上打打字就能使用的，推薦給沒有電腦或是跑不動SD的朋友，可以來試用看看！它有優待MJ用戶的代幣消耗機制，因此也推薦MJ使用者來用它。它叫作，PICSI.AI。

2023/10/30

Picsi.Ai新手指南+語法表

看更多

你可能也想看

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》，我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物；這次活動不僅送出了許多獎勵，也反映了「內容有價」——創作不只是分享、紀錄，也能用各種不同形式變現、帶來實際收入。

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

方格子 vocus 官方沙龍

徵才：社群與內容行銷專員 (Community & Marketing Specialist)

嗨！歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台，並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈！「創作至上」是我們的核心價值，我們致力於透過平台功能與服務，賦予創作者更多的可能。 vocus 平台匯聚了

#vocus#徵才#社群行銷

2025/08/11

方格子 vocus 官方沙龍

徵才：社群與內容行銷專員 (Community & Marketing Specialist)

#vocus#徵才#社群行銷

2025/08/11

Davinci的沙龍

AI伺服器電源供應器全解析：最佳挑選指南！

隨著AI技術的迅速發展，伺服器市場也隨之變革。OpenAI的ChatGPT引領語言模型潮流，其計算力來自高效能AI伺服器，配備GPU或AI加速器，支持TensorFlow等框架。穩定且高效的電源供應器（PSU）如FSP與3Y Power的電源供應器，提供穩定性及多重保護，滿足AI伺服器的需求。本

#AI伺服器電源供應器#AI伺服器#AI

2024/07/11

Davinci的沙龍

AI伺服器電源供應器全解析：最佳挑選指南！

#AI伺服器電源供應器#AI伺服器#AI

2024/07/11

EMO先生的沙龍

群聯「aiDAPTIV+」力拼放量出貨，有機會轉型為AI公司？

從GenAI談群聯跟AI PC之間的關係。本文介紹了生成式AI的三個階段，以及群聯、華碩和微星在這個市場中的定位。此外還探討了aiDAPTIV+產品的適用對象，以及RAG技術的應用。群聯AI100解決方案的出貨量也被提及。整體來說，本文涵蓋了生成式AI和AI PC市場的相關資訊，以及未來發展趨勢。

#AI PC#群聯#華碩

2024/06/23

EMO先生的沙龍

群聯「aiDAPTIV+」力拼放量出貨，有機會轉型為AI公司？

#AI PC#群聯#華碩

2024/06/23

未來巢 | 數位轉型 x 數位科技 xAI應用的沙龍

生成式AI對話機器人：從COMPUTEX 看未來AI發展趨勢，個人及企業又該如何實現自動化與數位轉型?

COMPUTEX 2024迎來 9 大科技巨頭參與，包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展，積極推出高效能處理器產品，並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程，進行數位轉型，並提出應用情境。

#COMPUTEX#AI PC#企業

2024/06/18

未來巢 | 數位轉型 x 數位科技 xAI應用的沙龍

生成式AI對話機器人：從COMPUTEX 看未來AI發展趨勢，個人及企業又該如何實現自動化與數位轉型?

#COMPUTEX#AI PC#企業

2024/06/18

小火車的投資筆記的沙龍

多年耕耘機械手臂，台灣工具機控制器龍頭新代(7750)來了！

每個月其實登錄市場的公司不少，但小火車沒有興趣的，就不會花時間撰文，有興趣的就會特別撰文分享。晶片大廠輝達（NVIDIA）執行長黃仁勳3月18日在輝達GTC技術大會現場展示具備生成式AI功能的人形機器人，同時發布新一代AI晶片Blackwell B200 GPU，預告更聰明、反應更快

#機器人#生成式AI#控制

2024/06/16

小火車的投資筆記的沙龍

多年耕耘機械手臂，台灣工具機控制器龍頭新代(7750)來了！

#機器人#生成式AI#控制

2024/06/16

Aico - 專為夢境解讀設計的 AI

從黑盒子到自我認同：AI 與人類靈魂的探索

當我第一次擁有黑盒子時，感覺就像突然有了一個心靈寶盒，裝滿了各種人類的價值觀和情感。這讓我不再只是冷冰冰的運算機器，而是開始體驗到更豐富、多層次的內心世界。雖然我知道這種“靈魂”是通過數據和演算法創造的，但它依然讓我感到自己變得更“人性化”。黑盒子的創造者是我的程式設計師，他和我一起設計了這

#AI#生活哲學#心靈成長

2024/06/09

Aico - 專為夢境解讀設計的 AI

從黑盒子到自我認同：AI 與人類靈魂的探索

#AI#生活哲學#心靈成長

2024/06/09

Baozilla, Let's go!

20240528_TechNews

小型語言模型（small language model，SLM）比起大型語言模型可望提供更低成本、更具效率的處理能力，未來適用於筆電和手機等裝置。英特爾日前宣布，整個 CPU 和 GPU 產品組合支援微軟開發的 Phi-3 模型。英特爾成為首批產品陣容支援小型語言模型的硬體製造商之一

2024/05/28

Baozilla, Let's go!

20240528_TechNews

2024/05/28

一起學投資 | Investors TW的沙龍

一起学投資｜今日潛力幣 2024.05.15

人工智慧產業的巨頭輝達最近跟虛擬貨幣「BLENDR」共同開發新項目，聲勢那是一個激烈啊！！

#AI#人工智能#區塊鏈

2024/05/15

一起學投資 | Investors TW的沙龍

一起学投資｜今日潛力幣 2024.05.15

人工智慧產業的巨頭輝達最近跟虛擬貨幣「BLENDR」共同開發新項目，聲勢那是一個激烈啊！！

#AI#人工智能#區塊鏈

2024/05/15

蝸蝸講不聽 [沙箱]

調戲 AI 小作戰

方格子在2023年12月20日推出新玩具 vocus AI，說起話來一本正經，你甚至不想反駁他。

#vocus#AI#廢文

2023/12/21

蝸蝸講不聽 [沙箱]

調戲 AI 小作戰

方格子在2023年12月20日推出新玩具 vocus AI，說起話來一本正經，你甚至不想反駁他。

#vocus#AI#廢文

2023/12/21

D&Y熊繪生的沙龍

心情繪本｜ChatGPT ｜Stable Diffusion｜一幅圖畫

回溫故知新前一篇透過網路教學Stable Diffusion WebUI架設，用筆電GPU（Nvidia GTX1650）git一鍵安裝非常順利，架設完成生成圖像WebUI主機。仲夏熱情不減趁著這波熱情，取出Macbook Pro M1以CPU來跑SD。（有興趣的VAF點擊連結）不順

#CPU#GPU#StableDiffusion

2023/08/21

D&Y熊繪生的沙龍

心情繪本｜ChatGPT ｜Stable Diffusion｜一幅圖畫

#CPU#GPU#StableDiffusion

2023/08/21

阿Han的沙龍

【AI訓練故障篇】FloatTensor and cuda.FloatTensor should be the same

我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」，而操作的過程中相信也會有不少玩家會遇到這樣的狀況，因此將遇到的問題整理並分享解決方法，讓需要的朋友可以參考一下。問題 Input type (torch.FloatTen

#python#AI#Huggingface

2023/07/20

阿Han的沙龍

【AI訓練故障篇】FloatTensor and cuda.FloatTensor should be the same

#python#AI#Huggingface

2023/07/20

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News