ComfyUI 研究 - IPAdapter 簡介

更新於 2024/03/03閱讀時間約 3 分鐘

這篇簡單介紹IPAdapter的應用。

IPAdapter的官方全稱是Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models,意思是在文生圖的過程中加入一個圖像提示詞的擴散模型去影響生成結果。


基本工作流

IPAdapter的節點使用跟LORA類似,只要加在模型-KSampler中間就可以使用,如下圖。

raw-image


在ComfyUI中的節點只要從節點處拉出路徑, 就會自動跳出建議串接的節點,非常方便。

raw-image


只要接好相關的節點並下載模型放到對應的資料夾,就可以順利使用。

在使用IPAdapter後可以省去大部分的文字提示詞,生成的圖像很大程度地採用來源圖像的構圖、元素跟風格。

下圖左邊是來源圖片,右邊是生成圖片,權重(weight)採用0.5,文字提示詞在圖片下方。

raw-image


  • 正向:black cat,
  • 負向:text, watermark, worst quality, bad anatomy,

如果將權重設定為1,使用空白文字提示詞,生成的圖片比較如下。

raw-image


此時圖片只受選用的大模型跟來源圖片影響。


其他應用

以下簡單測試兩個IPAdapter的應用工作流。

IPA+ControlNet(canny)

下圖是IPA+ControlNet(Canny)的工作流截圖,圖中將IPA跟ControlNet拆成兩個群組方便理解跟調整參數。

raw-image


下圖是在工作流中串接了ControlNet後的效果,輸入圖片分別是左上:ControlNet來源圖片;左下:IPA來源圖片;右上:經ControlNet Canny預處理結果;右下:混合生成結果。

raw-image


可以看出生成的圖片受到左上圖片的構圖影響,風格受IPA來源圖片影響。

由於ControlNet的輸入是模型跟文字提示詞,輸出是Condition,所以可以採用並聯串接方式處理,不會與IPA產生衝突。


IPA+AnimateDiff

下圖的工作流是在AnimateDiff生成影片的工作流中加入了IPA,使用空白文字提示詞且沒有經過放大、修復等處理。

raw-image


來源圖片:

raw-image


生成動畫:

raw-image


可以看出來來源圖片的構圖、元素等有出現在生成的動畫之中,因為使用空白提示詞的關係,生成的動畫只受到來源圖片及選用的模型影響。


小結

IPAdapter對生成圖像的影響包含構圖、元素、人臉、風格...等,所以網路上可以找到很多工作流使用到IPAdapter的相關節點,甚至IPAdapter的作者也獨立出FaceID的節點專門用來進行換臉作業。

雖然IPAdapter非常方便好用,甚至連文字提示詞都不用寫就可以生成類似風格或人物的圖片,但是在控制強度上又過於強烈,所以在使用時需要特別注意權重(weight)的數值,如果想讓文字提示詞也發揮作用,勢必要降低權重。

實際上這跟初期使用LORA來影響生成圖像的內容一樣,只是LORA需要額外訓練,而且權重過高容易出現過度擬合而畫面崩壞的現象,多數LORA又只訓練了特定對象,如特定人物、服裝或風格,使用IPAdapter的好處是不需要額外訓練且生成的圖像沒有過擬合的現象。

光是不用訓練這點,IPAdapter的應用層面就比LORA廣泛許多。

而且新的基礎模型還在不斷地訓練跟推出中,每次都要重新訓練LORA所花的成本跟時間絕對是比使用IPAdapter或類似的功能要高的許多。

avatar-img
7.1K會員
76內容數
AI的時代已經來臨
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Frank Hsu的沙龍 的其他內容
這一篇要測試一下Video Linear CFG Guidance這個節點,在網路上很多的教學影片跟網友分享的工作流中會看到這個節點,據說這個節點不只可以用在生成影片的工作流中,也可以使用在一般的生成圖片工作流中。
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
這篇的主要目的是搭建出基本可用的Controlnet工作流。
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
這一篇要測試一下Video Linear CFG Guidance這個節點,在網路上很多的教學影片跟網友分享的工作流中會看到這個節點,據說這個節點不只可以用在生成影片的工作流中,也可以使用在一般的生成圖片工作流中。
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
這篇的主要目的是搭建出基本可用的Controlnet工作流。
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
ComfyUI教學第二階段之[Upscale&SDXL],本篇介紹 upscale 與 SDXL 的基本架構,包含相關控制項的調整、模型的選擇以及高級功能的使用。這個階段一共會分成三部影片、三篇文字版。
Thumbnail
ComfyUI教學第二階段之[使用ControlNet],除了介紹controlnet的使用方法,文末還有comfy在2023年12月的更新公告簡單導讀,帶你高速瀏覽一次更新內容。 這個階段一共會有三部影片、三篇文章。
Thumbnail
ComfyUI教學第二階段之[LoRA&Embeddings],本篇介紹如何套用lora、調用embeddings,這個階段一共會分成三部影片、三篇文字版。
Thumbnail
ComfyUI教學第一階段之[基本workflow],本篇講解如何建立一條基本的工作流程,安裝方式見上一篇。兩篇看完就可以安心開始進行基礎的文生圖,也配有影片。 你對ComfyUI的印象是甚麼? 我的話,在我被逼著開始用它之前,我對它的印象是這樣的…… 說老實話,我第一次看到這個畫面的
Thumbnail
ComfyUI教學第一階段之[全面安裝指南],帶你一步一步從頭做起,它確實沒有那麼簡單,卻也沒有那麼困難。本篇介紹從安裝前準備、安裝步驟,到添加擴充功能。帶你開啟AI算圖的深度旅程。配有影片。
Thumbnail
測試:含有「南極髮草(Deschampsia antarctica)萃取+阿魏酸(ferulic acid)和維生素C」的精華液→對[生活在城市化高污染地區+並每天>2hrs待在戶外]的婦女皮膚,有何幫助──TEWL、黑斑&角鯊烯過氧化%?
Thumbnail
因老化而發生的皮膚乾燥現象,除了已知與玻尿酸、 神經醯胺和膠原蛋白的減少相關外──研究發現:水通道蛋白(Aquaporins, AQPs)的表現...是導致皮膚保濕度不足的主因...
Thumbnail
人體研究:三胜肽(INCI: Tetradecyl Aminobutyroylvalylaminobutyric Urea Trifluoroacetate)──誘導"玻尿酸"增生→填補皺紋、緊緻肌膚...
Thumbnail
讀到這則偷偷說,非常難過。雖然這則偷偷說底下的大家目前留言都好溫暖,但看見越多人訴說自己的經驗,就又更加難受。 碩士論文題目恰巧與性侵倖存者有關,聚焦在約會關係性侵害上。
Thumbnail
在猴抱貓事件之後雖然獲得關注跟媒體的報導,當時卻還未有創立吱吱黨的想法,直到壽山台灣獼猴因研究用的無線電發報器導致頸部不適、受傷,才點燃了抗爭與「台灣獼猴吱吱黨」的創立。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
ComfyUI教學第二階段之[Upscale&SDXL],本篇介紹 upscale 與 SDXL 的基本架構,包含相關控制項的調整、模型的選擇以及高級功能的使用。這個階段一共會分成三部影片、三篇文字版。
Thumbnail
ComfyUI教學第二階段之[使用ControlNet],除了介紹controlnet的使用方法,文末還有comfy在2023年12月的更新公告簡單導讀,帶你高速瀏覽一次更新內容。 這個階段一共會有三部影片、三篇文章。
Thumbnail
ComfyUI教學第二階段之[LoRA&Embeddings],本篇介紹如何套用lora、調用embeddings,這個階段一共會分成三部影片、三篇文字版。
Thumbnail
ComfyUI教學第一階段之[基本workflow],本篇講解如何建立一條基本的工作流程,安裝方式見上一篇。兩篇看完就可以安心開始進行基礎的文生圖,也配有影片。 你對ComfyUI的印象是甚麼? 我的話,在我被逼著開始用它之前,我對它的印象是這樣的…… 說老實話,我第一次看到這個畫面的
Thumbnail
ComfyUI教學第一階段之[全面安裝指南],帶你一步一步從頭做起,它確實沒有那麼簡單,卻也沒有那麼困難。本篇介紹從安裝前準備、安裝步驟,到添加擴充功能。帶你開啟AI算圖的深度旅程。配有影片。
Thumbnail
測試:含有「南極髮草(Deschampsia antarctica)萃取+阿魏酸(ferulic acid)和維生素C」的精華液→對[生活在城市化高污染地區+並每天>2hrs待在戶外]的婦女皮膚,有何幫助──TEWL、黑斑&角鯊烯過氧化%?
Thumbnail
因老化而發生的皮膚乾燥現象,除了已知與玻尿酸、 神經醯胺和膠原蛋白的減少相關外──研究發現:水通道蛋白(Aquaporins, AQPs)的表現...是導致皮膚保濕度不足的主因...
Thumbnail
人體研究:三胜肽(INCI: Tetradecyl Aminobutyroylvalylaminobutyric Urea Trifluoroacetate)──誘導"玻尿酸"增生→填補皺紋、緊緻肌膚...
Thumbnail
讀到這則偷偷說,非常難過。雖然這則偷偷說底下的大家目前留言都好溫暖,但看見越多人訴說自己的經驗,就又更加難受。 碩士論文題目恰巧與性侵倖存者有關,聚焦在約會關係性侵害上。
Thumbnail
在猴抱貓事件之後雖然獲得關注跟媒體的報導,當時卻還未有創立吱吱黨的想法,直到壽山台灣獼猴因研究用的無線電發報器導致頸部不適、受傷,才點燃了抗爭與「台灣獼猴吱吱黨」的創立。