ComfyUI 研究 - 圖像提示詞

更新於 發佈於 閱讀時間約 3 分鐘

這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。

雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。

即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢竟沒有開源,很多玩家也受限於預算跟硬體,在短期內應該還不會影響到其他介面的使用者。

以下介紹幾個使用圖像提示詞的工作流。


官方圖生圖

ComfyUI官方提供的圖生圖工作流就是將KSampler>latent_image輸入來源改成VAE Encode。

raw-image


VAE Encode需要輸入image跟vae,然後轉換成latent image給其他節點使用。

在我之前的文章中,我直接串接VAE Encode跟VAE Decode加上VAE後,不用經過重新採樣(KSampler)就可以套用VAE讓圖像的品質改變。

ComfyUI 研究 - VAE Encode/ Decode

而官方的圖生圖工作流則是加入模型跟文字提示詞後,以來源影像轉換的latent image為其礎進行重新採樣重繪,會受到選用的模型跟文字提示詞影響出圖結果。

這個工作流的關鍵點還有denoise的數值設定,數值愈接近1,畫出來的圖會愈不像原圖,數值太低則是重繪程度太低,感受不到重繪的效果。

這個工作流的缺點在於文字提示詞在denoise>0.5時重要性會大幅提升,如果文字提示詞太少的話,會畫不出想要的畫面。


WD14 Tagger 圖生文生圖

下面的工作流是使用WD14 Tagger這個節點讓AI幫來源圖片打標籤,再輸出字串到文字提示詞節點使用,因為沒有將來源圖片作為基底,生出來的圖基本上就是文生圖的結果,跟原圖的差異很大,但原圖被辨識出來的元素有出現在生成的圖像裡。

raw-image


WD14 Tagger 圖生文+圖生圖

下面的工作流結合了WD14 Tagger圖生文跟官方圖生圖工作流程,生成的圖像在denoise = 0.7 時也可以生成接近原圖的圖片。

這個工作流適合拿來做風格轉換。

raw-image


結合不同影像

下面的工作流中,WD14 Tagger的來源圖片跟VAE Encode的來源圖片不同,生成的影像具備A影像的標籤元素與B影像的內容資訊。

這個工作流適合拿來結合不同圖片元素。

raw-image


SD Prompt Reader

下面這個工作流不同於WD14 Tagger的自動打標籤,而是去讀取圖片內含的提示詞等資訊,輸出給其他節點使用。

raw-image


如果原本是WebUI的使用者,在轉換到ComfyUI時一定會發現很難生成一樣的圖。

除了像之前這篇文章:ComfyUI 研究 - 預設工作流修改成A1111算法,把工作流改成WebUI的算法外,還要找到原本的提示詞、seed等資訊一一輸入。

雖然可以打開WebUI把圖片丟進去看這些資訊,但是使用SD Prompt Reader這個節點就可以省去這個步驟,直接把讀取到的資訊手動或自動輸入到其他節點使用。

唯一的缺點是輸入的圖片讀不到相關資訊時會報錯。


其他

其他諸如IPAdapter、Controlnet、InstantID、FaceSwap等節點,只要是需要輸入圖片作為參考的節點,廣泛來講都可以算是圖像提示詞的應用。

如果可以在使用時免去文字提示詞的部分,直接生成想要的人物、構圖、風格...,其實可以省去使用者更多測試跟思考的時間。

畢竟AI繪圖模型在訓練時,都是先有來源圖像,再讓AI自動打標,然後經過大量圖片跟長時間的訓練後才完成的。

自動化跟無腦使用,相信是AI繪圖要普及的兩個要素。

avatar-img
7.4K會員
81內容數
AI的時代已經來臨
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Frank Hsu的沙龍 的其他內容
這篇要研究文字提示詞的處理方式。
這篇要移除畫面中的特定物品後自動填滿
這篇介紹 Allor Plugin 的影像合成用節點。
這篇要運用自動遮罩、重繪、批次的技巧,幫同一個人物更換不同背景。 自動遮罩 自動遮罩採用Segment Anything這個節點組,載入圖片後可以依指定的提示詞自動產生遮罩圖像,這邊我要更換的是背景,所以先讓AI抓出人物後,再反轉遮罩範圍輸出,為了讓重繪圖像不要過於生硬,將遮罩進行了高斯模糊。
本篇要建立自動化的遮罩生成工作流。
這篇要研究文字提示詞的處理方式。
這篇要移除畫面中的特定物品後自動填滿
這篇介紹 Allor Plugin 的影像合成用節點。
這篇要運用自動遮罩、重繪、批次的技巧,幫同一個人物更換不同背景。 自動遮罩 自動遮罩採用Segment Anything這個節點組,載入圖片後可以依指定的提示詞自動產生遮罩圖像,這邊我要更換的是背景,所以先讓AI抓出人物後,再反轉遮罩範圍輸出,為了讓重繪圖像不要過於生硬,將遮罩進行了高斯模糊。
本篇要建立自動化的遮罩生成工作流。
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
別小看語言模型,我們的歷史記載,不是都靠著文本嗎?
Thumbnail
AI 繪圖是一種利用人工智慧技術,根據文字描述,生成出各種風格和主題的圖片的方法,不僅可以讓你實現你的想像力,還可以讓你了解到 AI 的創造力。
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
幾天前OpenAI公司發表了全新的「AI生成影片」技術:透過一段簡短的「文字」敘述,讓AI生成一分鐘、1080P畫質的精美逼真影片。 礙於能力時間有限,我只能從使用ChatGPT、Bing這一年來獲得的大量經驗,閱讀研究大量AI相關資料整理的結論,分享AI生成圖片影片對「親密關係」可能帶來的衝擊。
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
別小看語言模型,我們的歷史記載,不是都靠著文本嗎?
Thumbnail
AI 繪圖是一種利用人工智慧技術,根據文字描述,生成出各種風格和主題的圖片的方法,不僅可以讓你實現你的想像力,還可以讓你了解到 AI 的創造力。
Thumbnail
以​文字​建立​影像,有很多功能如下: 完成提示詞之後,選擇功能設定 1.模型版本:內有兩個模型 Image1屬於照片和插圖風格,Image2擬真人版風格,我還是喜歡Image2風格比較好看。 2.比例:3:4或4:3或1:1或16:9,這個有別於目前AI生圖都是1:1版型,這可以依據您想要使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
幾天前OpenAI公司發表了全新的「AI生成影片」技術:透過一段簡短的「文字」敘述,讓AI生成一分鐘、1080P畫質的精美逼真影片。 礙於能力時間有限,我只能從使用ChatGPT、Bing這一年來獲得的大量經驗,閱讀研究大量AI相關資料整理的結論,分享AI生成圖片影片對「親密關係」可能帶來的衝擊。