ComfyUI 研究 - 圖像提示詞

更新 發佈閱讀 3 分鐘

這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。

雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。

即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢竟沒有開源,很多玩家也受限於預算跟硬體,在短期內應該還不會影響到其他介面的使用者。

以下介紹幾個使用圖像提示詞的工作流。


官方圖生圖

ComfyUI官方提供的圖生圖工作流就是將KSampler>latent_image輸入來源改成VAE Encode。

raw-image


VAE Encode需要輸入image跟vae,然後轉換成latent image給其他節點使用。

在我之前的文章中,我直接串接VAE Encode跟VAE Decode加上VAE後,不用經過重新採樣(KSampler)就可以套用VAE讓圖像的品質改變。

ComfyUI 研究 - VAE Encode/ Decode

而官方的圖生圖工作流則是加入模型跟文字提示詞後,以來源影像轉換的latent image為其礎進行重新採樣重繪,會受到選用的模型跟文字提示詞影響出圖結果。

這個工作流的關鍵點還有denoise的數值設定,數值愈接近1,畫出來的圖會愈不像原圖,數值太低則是重繪程度太低,感受不到重繪的效果。

這個工作流的缺點在於文字提示詞在denoise>0.5時重要性會大幅提升,如果文字提示詞太少的話,會畫不出想要的畫面。


WD14 Tagger 圖生文生圖

下面的工作流是使用WD14 Tagger這個節點讓AI幫來源圖片打標籤,再輸出字串到文字提示詞節點使用,因為沒有將來源圖片作為基底,生出來的圖基本上就是文生圖的結果,跟原圖的差異很大,但原圖被辨識出來的元素有出現在生成的圖像裡。

raw-image


WD14 Tagger 圖生文+圖生圖

下面的工作流結合了WD14 Tagger圖生文跟官方圖生圖工作流程,生成的圖像在denoise = 0.7 時也可以生成接近原圖的圖片。

這個工作流適合拿來做風格轉換。

raw-image


結合不同影像

下面的工作流中,WD14 Tagger的來源圖片跟VAE Encode的來源圖片不同,生成的影像具備A影像的標籤元素與B影像的內容資訊。

這個工作流適合拿來結合不同圖片元素。

raw-image


SD Prompt Reader

下面這個工作流不同於WD14 Tagger的自動打標籤,而是去讀取圖片內含的提示詞等資訊,輸出給其他節點使用。

raw-image


如果原本是WebUI的使用者,在轉換到ComfyUI時一定會發現很難生成一樣的圖。

除了像之前這篇文章:ComfyUI 研究 - 預設工作流修改成A1111算法,把工作流改成WebUI的算法外,還要找到原本的提示詞、seed等資訊一一輸入。

雖然可以打開WebUI把圖片丟進去看這些資訊,但是使用SD Prompt Reader這個節點就可以省去這個步驟,直接把讀取到的資訊手動或自動輸入到其他節點使用。

唯一的缺點是輸入的圖片讀不到相關資訊時會報錯。


其他

其他諸如IPAdapter、Controlnet、InstantID、FaceSwap等節點,只要是需要輸入圖片作為參考的節點,廣泛來講都可以算是圖像提示詞的應用。

如果可以在使用時免去文字提示詞的部分,直接生成想要的人物、構圖、風格...,其實可以省去使用者更多測試跟思考的時間。

畢竟AI繪圖模型在訓練時,都是先有來源圖像,再讓AI自動打標,然後經過大量圖片跟長時間的訓練後才完成的。

自動化跟無腦使用,相信是AI繪圖要普及的兩個要素。

留言
avatar-img
Frank Plaza
13.1K會員
89內容數
AI的時代已經來臨
Frank Plaza的其他內容
2024/04/06
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
2024/04/06
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
2024/04/02
測試一下InstantID
Thumbnail
2024/04/02
測試一下InstantID
Thumbnail
2024/04/01
測試一下 IPAdapter FaceID
Thumbnail
2024/04/01
測試一下 IPAdapter FaceID
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
AI圖形工具 今天分享一些常用的AI圖形工具。現在的圖形工具非常多,不可能全部都熟悉,因為真的太多了。所以介紹幾個比較常用的工具來供參考。算是我工作室的員工。 取代部分繪圖的工作 AI圖形工具基本上可以取代一部分繪圖的工作。就像速寫一樣,本身長年在畫速寫,但再怎麼說速度也不會比AI生成圖片來得
Thumbnail
AI圖形工具 今天分享一些常用的AI圖形工具。現在的圖形工具非常多,不可能全部都熟悉,因為真的太多了。所以介紹幾個比較常用的工具來供參考。算是我工作室的員工。 取代部分繪圖的工作 AI圖形工具基本上可以取代一部分繪圖的工作。就像速寫一樣,本身長年在畫速寫,但再怎麼說速度也不會比AI生成圖片來得
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News