FLUX.2 簡介與實測,與 Nana Banana Pro 比較

更新 發佈閱讀 25 分鐘

就在全世界都瘋迷 Nana Banana Pro 的時候,AI 影像生成模型的領先者之一 Black Forest Labs 公開了 FLUX.2,是前一代 FLUX.1 模型的繼承者。

FLUX.2 簡介

FLUX.2 可以生成出更具細節與真實照片感的圖片、更清晰更複雜的文字渲染與排版,擁有更好的指令遵循能力與更全面的現實世界知識,能輸出最多四百萬像素的圖片,支援多語輸入,並且可以輸入多達 10 張的參照圖片。

跟其他模型能力的比較上(ELO Score),FLUX.2 能在花費較小的成本下,擁有近乎第一名的分數。

如同第一代的策略,FLUX.2 也釋出一系列的版本:

  • FLUX.2 [pro]:系列中最強大的閉源模型,適合追求高品質圖片或是應用開發者
  • FLUX.2 [flex]:跟 pro 同為閉源模型,但可以控制更多模型參數,例如 Steps、CFG
  • FLUX.2 [dev]:32B 的開放權重模型,並針對消費級 GPU(如 RTX 系列)與 ComfyUI 進行了優化,適合需要在本地端運行或進行非商業開發的進階使用者
  • FLUX.2 [klein](尚未公開):Apache 2.0 授權的輕量化開源模型,透過蒸餾技術保留了原模型的核心能力,適合資源受限的應用場景
  • FLUX.2 - VAE:VAE 是模型的其中一部分,這次也一同開放權重(Apache 2.0 授權),應該對未來的開源生態有一定影響力。

pro 跟 flex 版本目前可以透過 Black Forest Labs 的 PlaygroundAPI 使用,dev 版本以及 VAE 可以在 HuggingFace 下載,並且可以在 ComfyUI 上使用。

技術上,FLUX.2 仍然採用目前最流行的 Latent Flow Matching,與 Qwen Image 等新興模型同樣使用 VLM(Vision-Language Model)作為 Text Encoder(這是能支援多語輸入與圖片輸入的關鍵原因),並且同樣採用 MM-DiT(MultiModel Diffusion Transformer)加 Parallel DiT 為主架構。

想要了解更多 FLUX.2 技術,可以參考這篇以及這篇文章

FLUX.2 實測,以及與 Nana Banan Pro 比較

我用能力最強的 FLUX.2 [pro] 測試,同樣的 Prompt 也透過 Gemini 介面讓 Nana Banan Pro 生成。為了簡化測試,我沒有使用圖片輸入,而是單純比較兩者 Text-to-Image 的能力。

一般場景(英文指令)

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A hyper-realistic extreme close-up portrait of an elderly woman with deep wrinkles and wise eyes, natural lighting, shot on 35mm Kodak Portra 400 film. Every pore and vellus hair is visible on her skin. Soft sunlight hitting the side of her face, creating a gentle chiaroscuro effect. Background is a blurred rustic kitchen. High texture, raw, authentic, unpolished, depth of field.

兩者都很強大,FLUX.2 在臉部細節、構圖、光影表現上我覺得小小勝出

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A macro shot of a complex mechanical pocket watch submerged in crystal clear water. Air bubbles are clinging to the brass gears. Golden light is refracting through the water and glass, creating intricate caustic patterns on the sandy bottom. The watch face is open, revealing rubies and intricate clockwork mechanisms. Hyper-detailed, ray-tracing quality, iridescent sheen, cinematic lighting.

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A solarpunk city built inside a massive transparent glass geodesic dome floating in the clouds. Lush vertical gardens and waterfalls cascading down white futuristic skyscrapers. People are flying on gliders between buildings. Warm golden hour sunlight passing through the glass dome, casting long shadows. Wide angle lens, epic scale, atmospheric depth, highly detailed vegetation.

上述兩個 Prompt,美感跟光影表現我都覺得 FLUX.2 都比 Banana 稍好一些。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A dramatic oil painting in the style of J.M.W. Turner. A ship caught in a violent storm at sea. Swirling chaotic brushstrokes of dark blues, angry yellows, and muted greys. Heavy impasto texture, visible thick paint buildup on the canvas simulating waves and clouds. A burst of dramatic, divine light breaking through the turbulent clouds in the center. Traditional media rendering, museum quality texture.

FLUX.2 給人更有壯闊感,Banana 則是把油畫的畫框也附上,給人更真實的感覺。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A breathtaking anime landscape painting in the style of Studio Ghibli. A solitary young traveler with a large backpack stands on a mossy cliff edge overlooking a vast, ancient valley filled with overgrown fantasy ruins and distant waterfalls. Enormous, fantastical cloud formations at sunset, casting warm orange, purple, and deep blue hues across the scene. Gentle wind blowing through long grass. Watercolor texture background, hand-painted feel, highly detailed vegetation. No text, no signs, no letters, no speech bubbles present in the image.

兩者都符合指定的日式動漫風格,FLUX.2 在細節表現上明顯勝出。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A retro Pop Art illustration, silkscreen print style art. A repeating 2x2 grid pattern featuring stylized, colorful retro boombox cassette players. Thick black outlines, flat bold primary colors (cyan, magenta, yellow, black), and heavy halftone dot patterns visible throughout the entire composition creating shading and texture. The aesthetic is graphic, flat, and intentionally mass-produced looking. No speech bubbles, no captions, no typography, no brand names, absolutely no text anywhere in the artwork.

兩者都符合指定的普普藝術風格,FLUX.2 產生的圖片風格比較明顯,有較多的純色色塊、對比明顯的顏色。

文字渲染(英文)

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A futuristic fashion magazine cover titled "FUTURE FLUX". The cover model is a cyborg woman with translucent skin revealing glowing circuits underneath, wearing avant-garde geometric clothing. The text "FUTURE FLUX" is written in bold, metallic, chrome typography at the top. Subtitles at the bottom read "THE NEXT GENERATION OF ART" in clean sans-serif font. Neon lighting, cyberpunk aesthetic, editorial layout, 8k resolution.

兩者都有正確產生指定的文字,甚至 Banana 還多「腦補」出一些文字。FLUX.2 可以透過參數設定輸出的圖片尺寸,我刻意設定為橫式,它有意識到雜誌封面應該是直式,所以產生兩邊留白的圖片。Banana 沒有辦法透過參數設定尺寸,它仍自動輸出橫式圖片,只是看起來比較不像雜誌封面。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A retro pop art illustration in the style of Roy Lichtenstein. A dramatic comic book panel showing a crying woman with blonde hair. Thick black outlines, bold primary colors (red, yellow, blue). The entire image has a visible vintage halftone dot print texture. A speech bubble above her head contains the text: "OH NO! FLUX IS TOO REAL!". The aesthetic is graphic, bold, and textured like old newsprint.

兩者都能正確渲染出指定的英文句子, Banana 同樣的還是會腦補文字。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A clean, modern horizontal infographic titled "COFFEE vs. TEA: DAILY FUEL" at the top in bold sans-serif font. The layout is divided down the middle into two distinct panels with a white background.
The left panel, colored with a warm brown header bar, features a stylized icon of a steaming coffee cup and coffee beans. Below the header "COFFEE", there are three bullet points with checkmark icons: "High Caffeine Content", "Quick Energy Boost", and "Bold, Rich Flavor".
The right panel, colored with a calming green header bar, features an icon of a teapot and tea leaves. Below the header "TEA", there are three bullet points with leaf icons: "Moderate Caffeine", "Sustained Focus", and "Antioxidant Rich Properties".
A subtle dividing line separates the two sections. The overall aesthetic is minimalist, digital, and easy to read.

對於簡單的英文資訊圖表,兩者的表現都很穩定。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: A complex, dense horizontal infographic visualization titled "BLUEPRINT FOR A SUSTAINABLE FUTURE CITY 2050" at the top center. The overall aesthetic is a futuristic technical blueprint with glowing blue and green lines on a dark background.
The central element is a stylized isometric map of a futuristic green city with vertical gardens and flying vehicles, labeled "CENTRAL HUB: ECO-METROPOLIS".
Connected to this central hub by data streams are four surrounding detailed data panels:
Top Left Panel: Titled "RENEWABLE ENERGY MIX". Shows a pie chart displaying percentages: "Solar 45%", "Wind 30%", "Hydro 25%", with corresponding icons.
Top Right Panel: Titled "URBAN MOBILITY FLOW". Shows a vertical bar chart comparing transport modes, with tall bars labeled "Public Transit (High)" and "Active Transport (Walk/Cycle)", and a short bar for "Private EVs (Low)".
Bottom Left Panel: Titled "CIRCULAR ECONOMY LOOP". Shows a four-stage circular flow diagram with arrows and icons: "DESIGN FOR LONGEVITY" -> "RESPONSIBLE CONSUMPTION" -> "RESOURCE RECOVERY (Recycle)" -> "RE-MANUFACTURING".
Bottom Right Panel: Titled "GREEN INFRASTRUCTURE GOALS". Shows an icon of a large tree canopy over buildings with a large data readout: "TARGET: 50% Urban Canopy Cover by 2050" and a smaller text "CO2 Sequestration Max.".
Many connecting lines, subtle grid patterns, and digital interface elements fill the background.

複雜的英文資訊圖表,兩者整體排版能力都相當強大,結構上都有遵循指令,但也都可以看出細節上的錯誤,例如 FLUX.2 右上角「 Private EVS」放在不對的位置,Banana 則的右上角則多出一個長條圖,而且小字的渲染看起來不太穩定。

一般場景(非英文指令)

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 一幅極具東方韻味的攝影作品,主題是「煙雨江南」。清晨,大霧瀰漫在古老的徽派建築群和蜿蜒的河流之上。畫面中有一座長滿青苔的石拱橋,一艘孤獨的烏篷船在平靜的水面上緩緩划過,留下一道波紋。整體色調偏冷、低飽和度,具有傳統水墨畫的留白與空靈感,光線柔和散射,畫面中沒有任何現代標識或文字。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 一幅廣闊、荒涼的美國西部風景畫,採用寫實主義風格。在金黃色的日落時分,橙色和深紫色的光線籠罩著巨大的紅色岩石峽谷和連綿起伏的砂岩地形。一條孤獨的、蜿蜒的泥土路穿過畫面中央,通向遠方。畫面中沒有任何植物或動物,只有壯麗的自然景觀。整體氛圍靜謐而宏大。圖片中沒有任何文字、標誌或數字。

從上述兩個 Prompt,可以看到兩個模型對於繁體中文的理解能力都相當好,產出的圖片符合預期。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 魔法のような雰囲気漂うファンタジーアート。深い古代の森の奥深く、苔むした岩や太い木の根に囲まれた神秘的な泉のほとりに、輝くユニコーンが水を飲んでいる。ユニコーンの体からは優しい光が放たれ、周囲の暗い森を照らしている。泉の水面には、森の木々や星空が映り込んでいる。空気中には微細な光の粒子が舞い、幻想的な雰囲気を醸し出している。画像内に文字、記号、数字は一切含まれていないこと。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 夕暮れ時の、歴史あるヨーロッパの石畳の通りを描いた写真のようなイラスト。両側には、古い石造りの建物や、装飾された鉄製のバルコニーが立ち並んでいる。通りの中央には、街灯の柔らかい光がオレンジ色に輝き始め、石畳に長い影を落としている。遠くには、大聖堂の尖塔が空に突き出ているのが見える。通行人や車両は描かれず、静かで落ち着いた、時間に取り残されたような雰囲気を表現。画像内に文字、ロゴ、数字、標識は一切含まれていないこと。

同樣的,兩者對於日文輸入的能力也都很好。

文字渲染(非英文)

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 一個復古工業風的咖啡廳吧台特寫鏡頭。背景是裸露的紅磚牆和銅管。畫面焦點是一個手寫風格的黑板菜單,黑板上用白色粉筆大寫著「今日特調:焦糖海鹽拿鐵」。黑板旁邊放著一台拉花很漂亮的義式咖啡機和幾個復古陶瓷杯。暖色調燈光,膠片顆粒質感,景深很淺。
FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 一張紀實攝影風格的照片,捕捉了台灣繁忙的傳統早市景象。狹窄的街道上擠滿了採買的人潮和緩慢移動的機車。陽光穿透塑膠遮雨棚的縫隙灑落下來,在濕漉漉的地面上形成光斑。畫面焦點是一個賣蔬菜的老婦人,她的攤位前插著一個用瓦楞紙板和黑色奇異筆手寫的牌子,上面清楚寫著「今日特價:高山高麗菜 一顆 50 元」。背景是雜亂的舊公寓建築、冷氣室外機和交錯的電線。底片顆粒質感,色彩飽和自然,充滿生活氣息。

可以看出 FLUX.2 對於稍微複雜的繁體中文渲染,能力與穩定度遠不及 Banana。順帶一提,兩者對於「台灣感」的理解度都滿高的(看那機車與舊公寓的感覺...)。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 設計一張社群宣傳圖,標題為「吃花生的三大好處」
圖片中間有一位可愛的 "花生君",有眼睛、嘴巴、手腳,笑容滿面
文字列出三大好處,每個好處有大字 (主要好處) 跟小字 (詳細說明):
「1. 維持心血管健康
花生富含單不飽和脂肪酸,有助於降低壞膽固醇,減少心臟病風險
卵磷脂可以幫助膽固醇代謝,預防膽固醇在血管中沉澱
2. 促進腸道健康
高膳食纖維有助於改善消化,預防便秘
纖維也能提供飽足感,有助於控制食量
3. 促進腸道健康
花生含有豐富的維他命E及其他抗氧化物,能保護細胞,延緩衰老
這有助於對抗體內的自由基,對身體的整體健康有益」
因為有爭取到動畫 "Spy x Family 間諜家家酒" 授權,左下角有 "安妮亞" 指著 "花生君" 說:「安妮亞想要這個」,興奮的表情
日系插圖風格
圖片比例 1:1

使用繁體中文來製作稍微複雜的資訊圖表時,Banana 的品質遠勝於 FLUX.2。

FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 80年代から90年代のOVAアニメのスクリーンショット風。雨に濡れた未来的な「ネオ東京」の夜景。高層ビルの屋上で、レトロなジャケットを着たキャラクターが街を見下ろしている。背景にある巨大なビルの側面に設置されたネオンサインが、ピンクと紫の光で「ネオ東京・ミッドナイト」と点滅している。VHSテープのようなノイズ、色収差、セル畫の質感、シティポップのアルバムジャケットのような雰囲気。
FLUX.2 [pro]

FLUX.2 [pro]

Nano Banana Pro

Nano Banana Pro

Prompt: 迫力のある少年漫画風のアニメ戦闘シーン。荒廃した都市の瓦礫の中で、傷ついた剣士の青年が最後の力を振り絞って刀を振り下ろしている。刀身から激しい青と黄色の雷のエフェクトが迸り、その雷のエネルギーそのものが空中で巨大な輝く文字となって「砕け散れ!雷鳴斬!」と具現化している。ダイナミックな構図、強いコントラスト、飛び散る破片、エフェクトの強調。トリガー作品風の力強いスタイル。

日文的文字渲染也有類似的問題,比較簡單的平假名、片假名問題不大,但對於複雜的漢字,FLUX.2 的跟 Banana 有一段差距。

實測心得與結論

FLUX.2 生成的圖片,不論在美感、構圖、光影等表現都相當不錯,甚至覺得大部分情況比 Nana Banana Pro 還好。對於英文指令的遵循程度以及英文文字渲染,兩者的能力也是不相上下。至於非英文的指令,就我測試的繁體中文跟日文來說,表現也都符合預期。能力差距較大的較複雜的文字,例如中文、漢字,Banana 的能力仍然是遠勝於 FLUX.2。如果需要製作非英文的資訊圖表、漫畫等,首選會是 Banana,但其他狀況仍然是可以考慮 FLUX.2 模型。

Black Forest Labs 上一代 FLUX.1 模型是開源社群的熱門模型,這次的 FLUX.2 同樣釋出 dev 版本的模型,相信這次的更新同樣會造成話題,相關的衍生模型、生態系也會隨著時間開枝散葉。

留言
avatar-img
嘉冠談 AI
8會員
5內容數
分享關於 AI 的基礎原理、實測、應用與新知
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
有用過 AI 畫圖的朋友應該都知道,AI 圖裡的中文字向來是硬傷,是介於亂碼跟火星文之間的問號存在。但現在起再也不一樣了。馬上來玩玩看!
Thumbnail
有用過 AI 畫圖的朋友應該都知道,AI 圖裡的中文字向來是硬傷,是介於亂碼跟火星文之間的問號存在。但現在起再也不一樣了。馬上來玩玩看!
Thumbnail
想要生成一張圖卻不知道怎麼下指令嗎?下對指令,AI替你畫圖! 由於著作權問題,不可直接拿取他人作品來使用,但是想要類似的圖片可以怎麼做呢? 三步驟馬上完成! 1.收集靈感 2.產生提示詞 3.圖像生成
Thumbnail
想要生成一張圖卻不知道怎麼下指令嗎?下對指令,AI替你畫圖! 由於著作權問題,不可直接拿取他人作品來使用,但是想要類似的圖片可以怎麼做呢? 三步驟馬上完成! 1.收集靈感 2.產生提示詞 3.圖像生成
Thumbnail
你想更改照片風格?你想要修改照片背景?你不會使用Photoshop?這都沒關係,讓Ai替你修圖吧! 三分鐘快速教你用AI無腦修圖! 使用Gemini2.5Flash模型,上傳圖片並下指令即可完成!
Thumbnail
你想更改照片風格?你想要修改照片背景?你不會使用Photoshop?這都沒關係,讓Ai替你修圖吧! 三分鐘快速教你用AI無腦修圖! 使用Gemini2.5Flash模型,上傳圖片並下指令即可完成!
Thumbnail
本文分享使用 Nano Banana AI 生成動畫分鏡的技巧與心得,包括準備參考圖片、撰寫完整提示詞、運用攝影與藝術術語、迭代與對話式編輯等,並提供一個精確有效的提示詞結構範例,助你輕鬆創作動畫分鏡。
Thumbnail
本文分享使用 Nano Banana AI 生成動畫分鏡的技巧與心得,包括準備參考圖片、撰寫完整提示詞、運用攝影與藝術術語、迭代與對話式編輯等,並提供一個精確有效的提示詞結構範例,助你輕鬆創作動畫分鏡。
Thumbnail
這麼厲害的生圖AI,不好好了解應用,未免太可惜了。 馬上就來跟你分享,如何將這個工具,先從「娛樂」,再升級成你的「生產力」。而要掌握這一切,你只需要學會一套極其簡單,由丁嫚自己嘗試,同時跟AI來回討論了2天後,總結出來的「C.L.O.S.E.五維提示詞結構法」。(專利要不要請起來😂)
Thumbnail
這麼厲害的生圖AI,不好好了解應用,未免太可惜了。 馬上就來跟你分享,如何將這個工具,先從「娛樂」,再升級成你的「生產力」。而要掌握這一切,你只需要學會一套極其簡單,由丁嫚自己嘗試,同時跟AI來回討論了2天後,總結出來的「C.L.O.S.E.五維提示詞結構法」。(專利要不要請起來😂)
Thumbnail
Nano Banana 社群爆紅,我該放棄原本的 AI 工具,改訂閱 Gemini 嗎?本篇攻略將帶你探索三個奈米香蕉的商業應用劇本,並提供三種主流 AI 生圖工具的完整比較,幫助你擺脫選擇困難,成為 AI 工具的策略家。
Thumbnail
Nano Banana 社群爆紅,我該放棄原本的 AI 工具,改訂閱 Gemini 嗎?本篇攻略將帶你探索三個奈米香蕉的商業應用劇本,並提供三種主流 AI 生圖工具的完整比較,幫助你擺脫選擇困難,成為 AI 工具的策略家。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News