FLUX.1 Kontext:AI 圖像生成與編輯的最新突破

更新於 發佈於 閱讀時間約 6 分鐘

2025年5月29日,Black Forest Labs 正式發布了 FLUX.1 Kontext,這是一款有如瑞士刀般多功能的 AI 圖像生成與編輯模型套件。相較於傳統的文字到圖像模型,FLUX.1 Kontext 引入了情境圖像生成(in-context image generation),允許用戶同時使用文字提示和參考圖像進行創作與編輯。準備好了嗎?讓我們一起了解 FLUX.1 Kontext 的厲害之處吧!

raw-image

Introducing FLUX.1 Kontext and the BFL Playground

FLUX.1 Kontext 的核心優勢

FLUX.1 Kontext 在圖像生成與編輯領域展現了多項領先功能,適用於創意設計、行銷推廣、遊戲開發等多元場景:

  • 情境圖像生成(in-context image generation):FLUX.1 Kontext 突破傳統文字到圖像的限制,能同時處理文字和參考圖像,實現無縫創作與編輯。無論是將一隻鳥從自然場景移到酒吧場景,或是將兩個角色放入電影院,模型都能保持角色特徵、風格和細節的一致性。
  • 迭代精煉:FLUX.1 Kontext [pro] 模型支援多輪編輯。你可以一步步疊加指令,在前一次編輯的基礎上建構,逐步改進圖像,同時保持視覺連貫性與高品質,而不用擔心圖像品質下降,對於需要反覆修改的設計流程來說,無疑是一大福音。
  • 寫實渲染與排版能力:FLUX.1 Kontext 在圖像生成品質上也毫不妥協。它能提供頂尖的圖像生成結果,具有強大的提示詞遵循能力、照片級真實渲染以及具競爭力的文字排版能力。無論是廣告素材還是品牌設計,都能輕鬆駕馭。
  • 局部編輯與風格保留:FLUX.1 Kontext 能跨越多個場景和環境,仍能保持參考角色或物件的獨特元素,也能對圖像的特定區域進行精準修改,同時保留整體風格,無需複雜的後期處理工具,甚至是根據參考圖片的獨特風格,結合文字提示生成全新的場景。
  • 高效能與低延遲:誰說強大就要慢?FLUX.1 Kontext 在生成和編輯時都具有極低的延遲。官方宣稱其推論速度比目前主流模型(例如 GPT-Image)快上 8 倍,而 [pro] 版本甚至比先前的頂級模型快上一個數量級
raw-image

Introducing FLUX.1 Kontext and the BFL Playground

與其他模型的性能比較

FLUX.1 Kontext 在性能評估中展現了顯著優勢,特別是在速度和品質上超越競爭對手:

  • 速度:Black Forest Labs 聲稱 FLUX.1 Kontext [pro] 的生成速度比現有頂尖模型快上數倍,[max] 版本則進一步提升性能,實現高品質與高速度的完美平衡。相較於 OpenAI 的 GPT-4o,FLUX.1 Kontext 的延遲顯著降低。
  • 品質與精準度:在 KontextBench 基準測試中,FLUX.1 Kontext [pro] 在文字編輯和角色保留任務中名列前茅,超越 GPT-4o。
  • 競爭優勢:相較於 MidJourney、DALL-E 和 Adobe Firefly,FLUX.1 Kontext 在提示遵循度、多輪編輯一致性和工作流程整合上更勝一籌。
raw-image

Introducing FLUX.1 Kontext and the BFL Playground

實際應用案例與潛在挑戰

從官方釋出的範例圖可以看出,FLUX.1 Kontext 在保持主體一致性並根據指令改變背景、姿態、數量等方面表現出色。另一組範例展示了將路邊文字招牌「YOU HAD ME AT BEER」修改為「YOU HAD ME AT CONTEXT」,並進一步將場景變為夜店風格,效果十分自然。

raw-image

Introducing FLUX.1 Kontext and the BFL Playground

當然,沒有完美的模型。儘管 FLUX.1 Kontext 表現出色,但其當前版本在多輪編輯後仍可能出現視覺偽影,影響圖像品質。此外,模型的世界知識有限,偶爾無法精準遵循特定提示要求。Black Forest Labs 也持續積極改進這些問題。

如何開始體驗 FLUX.1 Kontext?

這款模型套件包含三個版本:FLUX.1 Kontext [pro]、[max] 以及 [dev],其中 [pro] 和 [max] 已通過 KreaAI、Freepik、Lightricks、OpenArt、Leonardo 等平台開放使用,而 [dev] 目前處於私人測試階段,專供研究與安全測試使用。Black Forest Labs 同時推出了 BFL Playground,這是一個基於瀏覽器的演示環境,讓大家能快速體驗 FLUX.1 Kontext 的強大功能。


FLUX.1 Kontext 憑藉其情境圖像生成、快速迭代和高品質渲染,重新定義了圖像生成與編輯的標準。雖然仍有進步空間,但 Black Forest Labs 已經用 FLUX.1 Kontext 向世界證明,AI 圖像工具正朝著更智慧、更直觀、更強大的方向飛速發展。期待它們未來能為我們帶來更多驚喜!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
29會員
109內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/06/01
Gemini Diffusion Google 在本次 Google I/O 大會上,揭曉了一款名為 Gemini Diffusion 的實驗性文字生成模型。這款模型最大的亮點在於採用了「擴散技術 (Diffusion Techniques)」,與我們熟知的傳統自回歸語言模型 (Autoregre
Thumbnail
2025/06/01
Gemini Diffusion Google 在本次 Google I/O 大會上,揭曉了一款名為 Gemini Diffusion 的實驗性文字生成模型。這款模型最大的亮點在於採用了「擴散技術 (Diffusion Techniques)」,與我們熟知的傳統自回歸語言模型 (Autoregre
Thumbnail
2025/05/29
在 2025 年 Google I/O 大會上,Google 推出了兩款基於 Gemma 3 架構的創新 AI 模型:MedGemma 與 SignGemma。這兩款模型分別針對醫療應用與手語翻譯,展現了人工智慧在專業領域與無障礙溝通的巨大潛力。本文將介紹這兩款模型的功能、應用場景與未來發展
Thumbnail
2025/05/29
在 2025 年 Google I/O 大會上,Google 推出了兩款基於 Gemma 3 架構的創新 AI 模型:MedGemma 與 SignGemma。這兩款模型分別針對醫療應用與手語翻譯,展現了人工智慧在專業領域與無障礙溝通的巨大潛力。本文將介紹這兩款模型的功能、應用場景與未來發展
Thumbnail
2025/05/24
2025 年 5 月 20 日,Google 正式發布了 Gemma 家族的最新成員——Gemma 3n 的早期預覽版。這款模型不僅繼承了 Gemma 系列的強大基因,更將目光鎖定在我們日常生活中不可或缺的行動裝置上,致力於推動真正個人化、即時且私密的裝置端 AI 體驗。
Thumbnail
2025/05/24
2025 年 5 月 20 日,Google 正式發布了 Gemma 家族的最新成員——Gemma 3n 的早期預覽版。這款模型不僅繼承了 Gemma 系列的強大基因,更將目光鎖定在我們日常生活中不可或缺的行動裝置上,致力於推動真正個人化、即時且私密的裝置端 AI 體驗。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
其實,我建議,用編輯軟體(如: Canva 或 Photopea )處理文字可能比較方便(尤其想寫中文的話)。 我想介紹一個最近出現,在 TensorArt 中就能使用的生圖新技術 FLUX。我不確定稱他為 "新技術" 是否恰當,畢竟我不是 AI 繪圖這方面的專家,很難精準的說它是啥的,請見諒
Thumbnail
其實,我建議,用編輯軟體(如: Canva 或 Photopea )處理文字可能比較方便(尤其想寫中文的話)。 我想介紹一個最近出現,在 TensorArt 中就能使用的生圖新技術 FLUX。我不確定稱他為 "新技術" 是否恰當,畢竟我不是 AI 繪圖這方面的專家,很難精準的說它是啥的,請見諒
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
亞馬遜推出 AI 生成圖像工具 / reddit 更新品牌視覺 / 微軟小畫家加入 AI 圖像生成功能 / 中國第一起 AI 著作權判決案例 / Adobe 發布 DMV3D
Thumbnail
亞馬遜推出 AI 生成圖像工具 / reddit 更新品牌視覺 / 微軟小畫家加入 AI 圖像生成功能 / 中國第一起 AI 著作權判決案例 / Adobe 發布 DMV3D
Thumbnail
Luma AI 推出 3D 模型生成工具 / Figma 推出 FigJam AI / Eagle 推出 4.0 beta 測試版 / 2024 葛萊美最佳唱片包裝設計入圍 / 美國航空博物館推出新的品牌形象和視覺識別
Thumbnail
Luma AI 推出 3D 模型生成工具 / Figma 推出 FigJam AI / Eagle 推出 4.0 beta 測試版 / 2024 葛萊美最佳唱片包裝設計入圍 / 美國航空博物館推出新的品牌形象和視覺識別
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News