Stable Diffusion進階 -- 手部修復

閱讀時間約 6 分鐘
使用姿勢生成網站修復手部姿勢

前言

這篇討論一個常見的問題:如何修復修補錯亂的手部姿勢。
眾所周知,AI繪畫目前在複雜的肢體跟手腳趾上,常常有很恐怖的表現,最主要的原因是因為手跟手指其實非常非常難畫,就算是人類,想要畫出正常的手部與手指也是很困難的。
對於人類來說,手就是由手腕,指骨、指關節、指甲與皮膚構成的器官,有固定的選轉角度,手指屈伸範圍。任何一點不符合經驗的手部姿勢就代表受傷、骨折或畸形,馬上就會引發不適感。但是對AI來說,它沒有手的概念。事實上擴散式的AI其實沒有形成任何概念。對於人類來說是手掌的地方,對AI來說是一個銜接大塊肢體(前臂)與好幾根小肢體(手指)的銜接點。至於手指的數目跟彎曲方向,更是只能靠機率來算。
所以在很多靜態姿勢,例如女性坐著把手放在身側的圖,由於AI在訓練時,99%的機率都是出現在一樣的地方,所以在算圖的時候,AI就能很肯定地畫出手部。至於不常見的姿勢,以及動態高的姿勢,例如跳舞。由於這些地方手的姿態可以千變萬化,所以AI往往都是隨機挑一種姿態跟數量來拼過關。
其實AI在很多地方都用類似的方法,所以上下衣可以在奇怪的地方銜接在一起,花草的形狀可以完全不現實,但是人類其實不是很在意。不過同一招用在人類肢體上就逃不過人類法眼了。
當我們碰到AI畫出畸形手指或手部動作的時候,除了純粹使用inpaint重跑碰碰運氣之外,人類其實可以藉由某些輔助強化來提高AI重畫的成功率。這次就來提提使用人體姿勢生成網站加上繪圖軟體修正肢體後,再用inpaint來重繪的手部修復術。

問題

以我自己的練習作品為例:
男角的左手扭曲了
這個男角的左手基本上是不對的,原本的手指頭數量是很經典的AI六根指頭,加上一隻手有手套,一隻手沒有,只是後來用了Inpaint把女角的披肩挪過來遮住壞掉的手指部分。但其實仔細一看,還是能看出問題。
現在就來用綜合技巧來試試看修復這個壞掉的手。

手部採樣與置換

首先,要修復壞掉的手,就要先找到正確的手部形狀。
網路上有許多非常完整的姿勢生成網站可以讓大家建立角色的姿勢,我個人常用的是PoseMy.Art這個網站,它的免費版就已經預設了許多動漫構圖常用的人物姿勢,從這邊可以輕易找到公主抱這個經典動漫姿勢。將這個姿勢調整到與練習畫作差不多的角度,然後就可以截圖:
將紅框處截圖存檔
找到自己要的手部姿勢圖之後,開啟自己常用的繪圖或修圖軟體,將手部單獨選取出來。
然後用修圖軟體,將練習圖打開,把原本壞掉的手用塗抹工具或噴槍,用背景色或衣物的顏色遮蓋掉,開一個新圖層在上面,把我們要修復的手部貼在新圖層,再移動、縮放、旋轉、換色,合併圖層之後產生一個新的圖:
手部姿勢大致正確但顏色光影全不對的半成品
這張圖的手部姿勢大體上是正確的,現在要靠AI來幫我處理光影、色彩與材質。

AI算圖補正

將要補正的手跟附近的女角肩膀、衣物與斗篷附近都選擇起來,因為在補正手部姿勢時,會連帶影響附近衣物的皺褶與光影。
接下來Inpaint的設定是:
  • Inpaint area: Only masked
  • Denoising strength: 0.4到0.45,超過0.5就有可能讓整個手消失。
ControlNet部分,如果canny的預覽中,手部線條夠清晰,就可以使用canny配上權重0.5來試試看。否則寧可不開啟,避免干擾Inpaint發揮創意。
接著在正面提示詞中集中描述這個手的特徵:
best quality, masterpiece , hdr, ultra highres, hand wearing black leather gloves holding the back of the girl
在這個場景中,由於是公主抱,所以不能只描述手,而且最好同時描述手跟附近物品的互動關係,這樣可以讓AI在算圖時有更多線索,才不會把女角的衣物算成其他東西,或者把男角的手拉離女角的背。
在這邊,一樣需要漸進補正,每次Inpaint後評量成果。圖A跑出圖B後,如果更靠近自己想要的效果,就繼續把成果圖B再傳入Inpaint後調整選取範圍,再跑一次圖。如果成果不理想則重新對圖A重新執行Inpaint。當然如果時間與硬體允許,可以將Batch count開大一點,多圖比較擇優向前。
幾輪Inpaint下來,得到一個滿意的成果,就能收工了!
成果圖
對比半成品圖,就能發現AI不只是幫我將人物的手變換成黑手套的材質與光影,連手指的姿勢都變了一下,以更吻合手「抓住」女角背部的姿態。同時女角披肩的皺褶與光影都能符合該有的物理特性。這就是AI算圖強大的地方。只要有適合的指引,在細部的地方它能輕易做到人類畫手需要非常多經驗,花費許多時間才能做到的細節處理。
祝大家AI算圖愉快!

進階技巧目錄:
為什麼會看到廣告
18.5K會員
299內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
這篇要來介紹運用AI生圖將好幾張圖拼湊成一張時,準備工作一定會遇到的問題 -- 圖片去背。我們來看看目前有哪些人工智慧去背功能,以及人工智慧達不到我們要求時的簡單工人智慧去背方法。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
這篇要來介紹運用AI生圖將好幾張圖拼湊成一張時,準備工作一定會遇到的問題 -- 圖片去背。我們來看看目前有哪些人工智慧去背功能,以及人工智慧達不到我們要求時的簡單工人智慧去背方法。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Generative models have made remarkable strides in recent years, enabling machines to create diverse and realistic content across various domains. Amon
Thumbnail
stable-diffusion-webui AUTOMATIC1111在近期更新到1.6版了,我在本文中列出較重要的8個有感且實用的更新項目。 而那些較為底層的,或是專給高手使用的更新項目我就不細說了。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
ControlNet發布了1.1新版本,新增了許多不同的model,本文介紹運算大圖時非常好用的Tile Resample model。
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Generative models have made remarkable strides in recent years, enabling machines to create diverse and realistic content across various domains. Amon
Thumbnail
stable-diffusion-webui AUTOMATIC1111在近期更新到1.6版了,我在本文中列出較重要的8個有感且實用的更新項目。 而那些較為底層的,或是專給高手使用的更新項目我就不細說了。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
ControlNet發布了1.1新版本,新增了許多不同的model,本文介紹運算大圖時非常好用的Tile Resample model。
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。