ComfyUI 研究 - 多人構圖(三)

更新於 發佈於 閱讀時間約 3 分鐘

這篇要用Controlnet去達成多人構圖的目標。

來源圖片一樣透過Copilot生成,事實上Copilot非常適合用來抽圖,但是目前只能用文字控制,另外一天的免費加速額度有限,用完後生成速度會慢很多,要等上一天才可以再獲得加速額度,但肢體正確度與文字理解能力都非常強。


Scribble

Scribble的預處理器會將來源圖片處理成草稿形式,如下圖中間,然後再生成圖片。

raw-image

仔細看的話生成的圖片出現嚴重的肢體錯誤,因為模型非常不擅長處理倒過來的人臉。

我測試時使用的是 ComfyUI's ControlNet Auxiliary Preprocessors提供的Fake Scribble Lines (aka scribble_hed)節點,這個節點在處理高完成度的來源圖片時會產生比較像草稿的控制圖,如果來源圖片本身是手稿類草稿的話,可以使用Scribble Lines做預處理。

下圖左邊就是做為靈魂繪手的我,為了測試而犧牲小我畫出來的參考圖,中間是經過Scribble Lines處理過的參考圖,右邊是生成的圖片。

raw-image

當然,為了達到右邊生成的圖片效果,還是必須要在文字提示詞放入詳細的描述跟調整其他參數,如下圖將end_percent調整到0.3才獲得比較好的效果。

raw-image


Openpose

Openpose應該是最多人使用的Controlnet功能,透過偵測人臉跟肢體,很大程度的控制了生成圖片的人物姿勢,又不會受到來源圖片的元素影響。

下圖中間是使用Openpose pose預處理器處理後的控制圖,只偵測臉部的話生成的圖片跟來源圖片動作差異甚大,而且無法偵側倒過來的人臉。

raw-image


下圖中間是讓預處理器偵測手、身體、臉再次生成的圖片,一樣無法偵測到倒過來的人臉,生成的圖片動作跟來源圖片非常相近。

raw-image


下圖是將預處理器處理過的控制圖在繪圖軟體中處理拼接後,做為控制圖使用,雖然加入了倒立的人,但臉部跟肢體都崩壞了。

raw-image


Openpose的優點是專注在姿勢上,缺點就是預處理器無法處理倒過來的人臉,而非正面的臉會畫崩應該是StableDiffusion模型本身的侷限。


Canny

下圖是使用Canny的效果。

raw-image

Canny的預處理節點數值調整效果如下圖。

raw-image

使用Canny時因為會很高程度地採用原圖的線條,所以在繪製倒過來的人臉時也比較不容易崩壞掉,但同時細節也受到更高程度的限制,如果調整套用時的強度跟百分比,又會與控制圖差異過大,人數會產生變化,所以Canny比較常見使用在線稿轉彩稿的應用上。


Lineart

下圖是使用Lineart的效果。

raw-image

Lineart的效果跟Canny差不多,倒立的人臉也不太會崩壞,但是生成的圖片偏暗一點。

可能是受到搭配的模型在訓練時的資料影響。


小結

本篇簡單測試了幾個Controlnet的功能,雖然都可以在512*512的生成尺寸達到多人構圖的目標,但是共通的缺點是倒過來的人臉跟肢體容易崩壞掉,而不易崩壞掉的功能又會因為控制強度過高,使生成圖片跟參考圖片差異過小。

如果想要更好的控制構圖跟畫面品質,則必須搭配IPAdapter或FaceSwap等節點,工作流又會過於複雜.......。

看來探索的旅程還沒結束。

avatar-img
7.3K會員
81內容數
AI的時代已經來臨
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Frank Hsu的沙龍 的其他內容
接續著前篇,接著我要使用圖生圖的方式去達成多人構圖的目的,本篇會使用幾種圖生圖的工作流去測試。
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
來測試SDXL Lightning模型是不是真的很神奇。
這篇要搭建製作透明背景素材的工作流。
這一篇要測試一下Video Linear CFG Guidance這個節點,在網路上很多的教學影片跟網友分享的工作流中會看到這個節點,據說這個節點不只可以用在生成影片的工作流中,也可以使用在一般的生成圖片工作流中。
接續著前篇,接著我要使用圖生圖的方式去達成多人構圖的目的,本篇會使用幾種圖生圖的工作流去測試。
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
來測試SDXL Lightning模型是不是真的很神奇。
這篇要搭建製作透明背景素材的工作流。
這一篇要測試一下Video Linear CFG Guidance這個節點,在網路上很多的教學影片跟網友分享的工作流中會看到這個節點,據說這個節點不只可以用在生成影片的工作流中,也可以使用在一般的生成圖片工作流中。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
今天噗浪上忽然一堆繪師在玩這個, 總之就是界面超簡潔的繪圖AI,可以幫你把草圖修成線稿, 也可以給他線稿+色彩定義,幫你畫成色稿。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
在這個AI的時代,若不會使用AI軟體 或仍不敢嘗試AI軟體,那你就落伍了 由於目前多數AI生成APP,大都為英文介面 應此造成有些人不敢嘗試 今天這個問題將由微軟Copilot來完全解決 今天要談的是微軟Copilot的外掛程式 Image Creator,圖像創造器 它神奇之處是
Thumbnail
Microsoft Copilot 上線新功能!除了免費使用 GPT-4 大型語言模型之外,更支援 DALL-E 3 自動生成圖像功能,根據使用者輸入的文字描述來生成各種風格的圖像。生成圖像不再受到尺寸限制的束縛,現在 Copilot 不僅能生成正方形圖像,還能輕鬆生成 16:9 的長方形圖像。
Thumbnail
這是一個關於Microsoft Copilot Studio的專題系列文章,作者分享了選擇Copilot Studio這個主題的原因,並宣佈了系列文章的開始。
Thumbnail
AI繪圖也已經發展了好一段時間,這陣子也才真正的想要來試試看,以下分享的都是使用微軟的Copilot所畫出來,並附上prompt給大家參考,中英文都可以,有興趣的可以試試看,不過要小心,很容易上癮...
Thumbnail
ComfyUI教學第二階段之[使用ControlNet],除了介紹controlnet的使用方法,文末還有comfy在2023年12月的更新公告簡單導讀,帶你高速瀏覽一次更新內容。 這個階段一共會有三部影片、三篇文章。
Thumbnail
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
今天噗浪上忽然一堆繪師在玩這個, 總之就是界面超簡潔的繪圖AI,可以幫你把草圖修成線稿, 也可以給他線稿+色彩定義,幫你畫成色稿。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
在這個AI的時代,若不會使用AI軟體 或仍不敢嘗試AI軟體,那你就落伍了 由於目前多數AI生成APP,大都為英文介面 應此造成有些人不敢嘗試 今天這個問題將由微軟Copilot來完全解決 今天要談的是微軟Copilot的外掛程式 Image Creator,圖像創造器 它神奇之處是
Thumbnail
Microsoft Copilot 上線新功能!除了免費使用 GPT-4 大型語言模型之外,更支援 DALL-E 3 自動生成圖像功能,根據使用者輸入的文字描述來生成各種風格的圖像。生成圖像不再受到尺寸限制的束縛,現在 Copilot 不僅能生成正方形圖像,還能輕鬆生成 16:9 的長方形圖像。
Thumbnail
這是一個關於Microsoft Copilot Studio的專題系列文章,作者分享了選擇Copilot Studio這個主題的原因,並宣佈了系列文章的開始。
Thumbnail
AI繪圖也已經發展了好一段時間,這陣子也才真正的想要來試試看,以下分享的都是使用微軟的Copilot所畫出來,並附上prompt給大家參考,中英文都可以,有興趣的可以試試看,不過要小心,很容易上癮...
Thumbnail
ComfyUI教學第二階段之[使用ControlNet],除了介紹controlnet的使用方法,文末還有comfy在2023年12月的更新公告簡單導讀,帶你高速瀏覽一次更新內容。 這個階段一共會有三部影片、三篇文章。
Thumbnail
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能