ComfyUI Flux Redux 圖像風格轉換 #1:圖片變體生成

更新於 發佈於 閱讀時間約 7 分鐘

俗話說, 一張圖勝千言萬語(好啦我不知道誰說的), 如果你想要一個畫面, 有時候很難一口氣描述出來, 那最好的方式, 就是把這張圖給AI跟他說, 我就是想要這樣的, 但是我要#@$#$的變化...

針對單一圖片進行風格變換或細節調整, 有我之前提到使用 IPAdapter的方式

產生多個風格版本, 這次來試試 Flux Redux搭建的工作流程, 速度或是風格上有更大的彈性

Flux Redux 是專為 ComfyUI 設計的圖像變體生成適配器模型(adapter model ),能夠根據輸入圖片直接提取風格特徵並生成相似風格的新圖像,完全不需要文字提示詞。這使它非常適合用於風格轉換、圖片變體創作,以及多圖混合風格的應用場景。

看一下官方網站的圖片就可以知道做到什麼程度:

raw-image
raw-image

主要特點

  • 無需文字提示:直接從參考圖片中提取風格,生成變體。
  • 多圖混合(這個我們另外一篇文章來說明):可同時輸入多張圖像,融合多種風格。
  • 高兼容性:支援 Flux.1 [Dev] 與 [Schnell] 版本模型。
  • 適合批量變體生成:特別適合需要大量風格一致變體的創作需求

 下載必要模型

CLIP Vision (sigclip_vision_patch14_384.safetensors) 放到 ComfyUI/models/clip_vision

Redux 模型 (flux1-redux-dev.safetensors) 放到 ComfyUI/models/style_models

下載工作流

點選以下來自 ComfyUI flux example介紹頁面 的這張圖片放大到原圖(不是縮圖), 拖曳到comfyui介面, 就會看到工作流:

raw-image

工作流解說

工作流如下, 我用兩個部分來說明, 熟悉之後就可以按照看官您的習慣排成你想要的樣子

raw-image

B部分 - 基本Flux工作流

B部分就是我們之前提到的 Flux 工作流, 詳細可以參考之前的文章

我下載的是GGUF版本的flux, 所以這邊更換節點使用Unet Loader載入GGUF版本的Flux

raw-image

提一下 ModelSamplingFlux (有機會我再補上測試圖)

ModelSamplingFlux 節點讓你可以精細控制模型取樣時的「自由度」,進而影響生成圖像的風格與細節。先維持預設值是一個不錯的起點

max_shift、base_shift 主要調整變化幅度,base_shift 是起點,max_shift 是上限,

偏移值低時,結果較穩定、貼近訓練資料;偏移值高時,變化大但可能產生不預期效果

width、height 則決定輸出尺寸(這裡和輸出的潛像尺寸連動)

raw-image

B部分最常用到的, 就是修改提示詞, 可以從這邊改變風格, 例如將原圖改成 comic style, photography style 等等

A部分 - Flux Redux 工作流

由左上角開始看,

Load CLIP Vision 載入 CLIP Vision 模型(sigclip_vision_patch14_384.safetensors),這是用來將圖片轉換為可被 AI 理解的「視覺特徵」的基礎模型

利用  Load Image 載入一張參考圖片(例如一隻貓的照片),作為風格和內容參考

CLIP Vision Encode 用 CLIP Vision 模型對這張圖片進行編碼,產生 CLIP_VISION_OUTPUT,這是一組高度抽象化的視覺特徵向量,後續將用於風格轉換

Load Style Model 載入 Redux 風格模型(flux1-redux-dev.safetensors),這個模型專門用來實現圖片變體生成與風格轉換

注意這邊原本是使用ApplyStyleModel, 我換成另外一個更直觀的節點來做操作

點選 Manager -> Custom Node 搜尋 Comfyui_Redux_Advanced 安裝後重新啟動ComfyUI

raw-image

使用 StyleModelApplySimple(或 ReduxAdvanced)

raw-image

這個節點將三個來源(conditioning、style_model、clip_vision_output)結合起來,根據「image_strength」參數(預設 highest),決定參考圖片的風格影響力

這裡的 conditioning 通常是 text prompt(來自於我們flux工作流的Text Prompt),image_strength 設為 highest,圖片的風格會完全主導生成,prompt 幾乎不起作用

設定到 medium, 那就是圖片參考50%, 提示詞參考50%

來看一下效果, 還是跟圖片和提示詞種類有很大差異, 都要測試一下喔(廢話😆)

提示詞 comic style , 來源圖是一隻貓咪, 由右到左image_strength是highest, high, medium, low的結果如下

可以看到在low的時候幾乎不管參考圖了, 完全變成了狗...

highest的時候完全不管提示詞, 就是圖片貓

medium 圖片參考50%, 提示詞參考50%, 理論上應該要變漫畫風但是沒有表現很好, 要馬就是換動漫的model或是增加lora強化一下, 或是修改更詳細的動漫提示詞

raw-image

我調整了一下提示詞, 這次要做3D卡通貓:

3d cartoon character, cute, chibi, highly detailed, vibrant colors, big eyes, smooth shading, pixar style, soft lighting

結果如下,

這次把原來的貓咪拿來做比對, 那這次的話我選high的效果是我要的

raw-image

多跑幾次, 也會有各種變種:

raw-image

好像狐狸了....

raw-image

你會喜歡哪一種風格呢?



參考資料

ComfyUI Advanced Reflux Control

官方介紹Flux Tools文章

ComfyUI Wiki

ComfyUI Flux Examples

留言
avatar-img
留言分享你的想法!
avatar-img
學習 n8n 和 ComfyUI 的筆記
2會員
10內容數
紀錄學習ComfyUI的筆記, 如果有建議或是更正, 還請大家不吝指教, 謝謝
2025/05/16
本教學文章說明如何在 ComfyUI 中使用 IPAdapter 進行風格轉換。IPAdapter 是一種風格參考工具,能從參考圖片中提取風格並應用到目標圖片上,類似單圖 LoRA 但不需要大量訓練數據。文章詳細介紹了模型與節點的下載安裝、工作流的調整、雲端算力、使用技巧和注意事項。
Thumbnail
2025/05/16
本教學文章說明如何在 ComfyUI 中使用 IPAdapter 進行風格轉換。IPAdapter 是一種風格參考工具,能從參考圖片中提取風格並應用到目標圖片上,類似單圖 LoRA 但不需要大量訓練數據。文章詳細介紹了模型與節點的下載安裝、工作流的調整、雲端算力、使用技巧和注意事項。
Thumbnail
2025/05/16
這篇文章介紹如何使用ComfyUI將圖片轉換成不同的繪畫風格,以將真人照片轉換為2.5D動畫風格為例,詳細說明瞭節點的組裝、模型的選擇、提示詞的使用以及參數設定,並展示了不同denoise參數下產生的不同效果。
Thumbnail
2025/05/16
這篇文章介紹如何使用ComfyUI將圖片轉換成不同的繪畫風格,以將真人照片轉換為2.5D動畫風格為例,詳細說明瞭節點的組裝、模型的選擇、提示詞的使用以及參數設定,並展示了不同denoise參數下產生的不同效果。
Thumbnail
2025/05/14
這篇文章介紹如何在 ComfyUI 的 Flux 模型中使用 LoRA 來改善圖片生成,特別是解決人臉過度平滑的問題。文章詳細說明瞭 LoRA 的原理、優點、使用方法,以及如何下載、安裝和使用 LoRA 節點。並透過實際案例展示了不同 LoRA 的效果差異。
Thumbnail
2025/05/14
這篇文章介紹如何在 ComfyUI 的 Flux 模型中使用 LoRA 來改善圖片生成,特別是解決人臉過度平滑的問題。文章詳細說明瞭 LoRA 的原理、優點、使用方法,以及如何下載、安裝和使用 LoRA 節點。並透過實際案例展示了不同 LoRA 的效果差異。
Thumbnail
看更多
你可能也想看
Thumbnail
其實,我建議,用編輯軟體(如: Canva 或 Photopea )處理文字可能比較方便(尤其想寫中文的話)。 我想介紹一個最近出現,在 TensorArt 中就能使用的生圖新技術 FLUX。我不確定稱他為 "新技術" 是否恰當,畢竟我不是 AI 繪圖這方面的專家,很難精準的說它是啥的,請見諒
Thumbnail
其實,我建議,用編輯軟體(如: Canva 或 Photopea )處理文字可能比較方便(尤其想寫中文的話)。 我想介紹一個最近出現,在 TensorArt 中就能使用的生圖新技術 FLUX。我不確定稱他為 "新技術" 是否恰當,畢竟我不是 AI 繪圖這方面的專家,很難精準的說它是啥的,請見諒
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
接續著前篇,接著我要使用圖生圖的方式去達成多人構圖的目的,本篇會使用幾種圖生圖的工作流去測試。
Thumbnail
接續著前篇,接著我要使用圖生圖的方式去達成多人構圖的目的,本篇會使用幾種圖生圖的工作流去測試。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
這是一個簡單的工作流,可以對輸入的圖片進行3D重建
Thumbnail
這是一個簡單的工作流,可以對輸入的圖片進行3D重建
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News