ComfyUI 研究 - IPAdapter 簡介

更新於 2024/03/03發佈於 2024/03/03閱讀時間約 3 分鐘

這篇簡單介紹IPAdapter的應用。

IPAdapter的官方全稱是Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models，意思是在文生圖的過程中加入一個圖像提示詞的擴散模型去影響生成結果。

基本工作流

IPAdapter的節點使用跟LORA類似，只要加在模型-KSampler中間就可以使用，如下圖。

在ComfyUI中的節點只要從節點處拉出路徑，就會自動跳出建議串接的節點，非常方便。

只要接好相關的節點並下載模型放到對應的資料夾，就可以順利使用。

在使用IPAdapter後可以省去大部分的文字提示詞，生成的圖像很大程度地採用來源圖像的構圖、元素跟風格。

下圖左邊是來源圖片，右邊是生成圖片，權重(weight)採用0.5，文字提示詞在圖片下方。

正向：black cat,
負向：text, watermark, worst quality, bad anatomy,

如果將權重設定為1，使用空白文字提示詞，生成的圖片比較如下。

此時圖片只受選用的大模型跟來源圖片影響。

其他應用

以下簡單測試兩個IPAdapter的應用工作流。

IPA+ControlNet(canny)

下圖是IPA+ControlNet(Canny)的工作流截圖，圖中將IPA跟ControlNet拆成兩個群組方便理解跟調整參數。

下圖是在工作流中串接了ControlNet後的效果，輸入圖片分別是左上：ControlNet來源圖片；左下：IPA來源圖片；右上：經ControlNet Canny預處理結果；右下：混合生成結果。

可以看出生成的圖片受到左上圖片的構圖影響，風格受IPA來源圖片影響。

由於ControlNet的輸入是模型跟文字提示詞，輸出是Condition，所以可以採用並聯串接方式處理，不會與IPA產生衝突。

IPA+AnimateDiff

下圖的工作流是在AnimateDiff生成影片的工作流中加入了IPA，使用空白文字提示詞且沒有經過放大、修復等處理。

來源圖片：

生成動畫：

可以看出來來源圖片的構圖、元素等有出現在生成的動畫之中，因為使用空白提示詞的關係，生成的動畫只受到來源圖片及選用的模型影響。

小結

IPAdapter對生成圖像的影響包含構圖、元素、人臉、風格...等，所以網路上可以找到很多工作流使用到IPAdapter的相關節點，甚至IPAdapter的作者也獨立出FaceID的節點專門用來進行換臉作業。

雖然IPAdapter非常方便好用，甚至連文字提示詞都不用寫就可以生成類似風格或人物的圖片，但是在控制強度上又過於強烈，所以在使用時需要特別注意權重(weight)的數值，如果想讓文字提示詞也發揮作用，勢必要降低權重。

實際上這跟初期使用LORA來影響生成圖像的內容一樣，只是LORA需要額外訓練，而且權重過高容易出現過度擬合而畫面崩壞的現象，多數LORA又只訓練了特定對象，如特定人物、服裝或風格，使用IPAdapter的好處是不需要額外訓練且生成的圖像沒有過擬合的現象。

光是不用訓練這點，IPAdapter的應用層面就比LORA廣泛許多。

而且新的基礎模型還在不斷地訓練跟推出中，每次都要重新訓練LORA所花的成本跟時間絕對是比使用IPAdapter或類似的功能要高的許多。

Frank PlazaComfyUI 研究

留言

留言分享你的想法！

Frank

發文者

2024/03/20

在ComfyUI 研究 - 多人構圖（二）提及了這篇文章，趕快過去看看吧！

Frank Plaza

10.0K會員

88內容數

AI的時代已經來臨

Frank Plaza的其他內容

2024/04/06

ComfyUI研究 - 虛實轉換

這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流，還可以幫線稿上色。

2024/04/06

ComfyUI研究 - 虛實轉換

這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流，還可以幫線稿上色。

2024/04/02

ComfyUI研究 - InstantID

測試一下InstantID

2024/04/02

ComfyUI研究 - InstantID

測試一下InstantID

2024/04/01

ComfyUI研究 - IPAdapter FaceID

測試一下 IPAdapter FaceID

2024/04/01

ComfyUI研究 - IPAdapter FaceID

測試一下 IPAdapter FaceID

看更多

你可能也想看

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Joker Cat

紀錄 imgur 如何上傳圖片到自己的相簿

此為不負責任教學，介面操作依實際情況而有所異動額外資源參考 [API] 串接 Imgur API 圖床服務，上傳到指定相簿 israynotarray超完整 Express Imgur 套件上傳教學 [前端筆記] 用 axios 串接 imgur API上傳圖片

#imgur#學習#前端

2024/06/07

Joker Cat

紀錄 imgur 如何上傳圖片到自己的相簿

#imgur#學習#前端

2024/06/07

再寫5分鐘

軟體設計模式 | 觀察者模式

觀察者模式透過主題訂閱/訊息通知的機制，極度增強系統的可擴展性、靈活性以及降低組件間的耦合度。概念直觀簡單，是非常實用的設計模式。

#軟體開發#軟體工程師#設計模式

2024/05/03

再寫5分鐘

軟體設計模式 | 觀察者模式

觀察者模式透過主題訂閱/訊息通知的機制，極度增強系統的可擴展性、靈活性以及降低組件間的耦合度。概念直觀簡單，是非常實用的設計模式。

#軟體開發#軟體工程師#設計模式

2024/05/03

再寫5分鐘

軟體設計模式 | 代理模式

代理模式通過封裝原始對象來實現對該對象的控制和管理，同時不改變原始對象的行為或客戶端與該對象互動的方式，以此介入或增強對該對象的訪問和操作。

2024/04/24

2024/04/24

ComfyUI研究 - IPAdapter Plus v2

IPAdapter節點重大更新，要不要更新呢？

#comfyui#stablediffusion#AI繪圖

2024/03/31

Frank Plaza

ComfyUI研究 - IPAdapter Plus v2

IPAdapter節點重大更新，要不要更新呢？

#comfyui#stablediffusion#AI繪圖

2024/03/31

Frank Plaza

ComfyUI 研究 - 多人構圖（四）

這篇要使用IPAdapter搭配遮罩來進行特殊的構圖方式。

#comfyui#stablediffusion#AI繪圖

2024/03/24

Frank Plaza

ComfyUI 研究 - 多人構圖（四）

這篇要使用IPAdapter搭配遮罩來進行特殊的構圖方式。

#comfyui#stablediffusion#AI繪圖

2024/03/24

阿Han的沙龍

【Python 技術選型】如何選出適合的API框架呢？

當我們在撰寫一套系統的時候，總是會提供一個介面讓使用者來觸發功能模組並回傳使用者所需的請求，而傳統的安裝包模式總是太侷限，需要個別主機獨立安裝，相當繁瑣，但隨著時代的演進與互聯網的崛起，大部分的工作都可以藉由網頁端、裝置端來觸發，而伺服端則是負責接收指令、運算與回傳結果，雲端

#python#FastAPI#flask

2024/03/12

阿Han的沙龍

【Python 技術選型】如何選出適合的API框架呢？

#python#FastAPI#flask

2024/03/12

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News