Stable Diffusion練習,這是利息

閱讀時間約 10 分鐘

前言

成品
這次來分享這個作品的製作過程。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。
於是SD會有非常大的機率變成女抱男或肢體混成一團,更別提同時出現好幾隻手或身體腰斬的恐怖情況。而如果是要將兩個人物LoRA同時用在這個圖上,更增加AI算圖的難度。
通常現行SD在處理同畫面多人不同LoRA時,用的技巧是Composable LoRA加上Latent Couple的手段:
但是,這種做法用在人物肢體交錯的圖時,就超出了它的處理能力:
人物區塊分佈
可以很明顯看到,中間的男性切分了左右畫面,女性橫貫在中間將男性分成兩半,同時男性的左手又扶在女性的後腰上,變成一塊孤島。
我曾經試過用Latent Couple畫出這種複雜度的切分圖,結果產生出來的圖非常、非常、非常慘烈。
這次就要來挑戰使用LoRA,ControlNet,inpaint加上img2img來完成這個作品。

生成半成品

首先,因為這張圖牽涉到兩個人物LoRA,我們不能直接使用提示詞加上LoRA來算圖,這樣會得到陰陽人雙胞胎,所以要先從不使用LoRA的草圖來做。
感謝 Fly Angel 同好的提點,其實Stable Diffusion可以很好地理解人類的自然語言,甚至在故意不加上太多負面提示詞的情況,有些模型可以生出非常絢麗的效果。我在這邊就使用了GhostMix加上描述人物與動作的半自然語言,一次產生一百張圖片,從中挑選一張可用的草圖:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres,
one strong man with blonde hair and long hair and wearing white tunic carry a girl on his arms,
the girl has long black hair and wearing white kimono and grey cloak and short red skirt and black knee boots,
the background is a landscape of mountains and forest
草圖
在這裡我故意不用各種精修臉部、身材眼睛等特徵的提示詞,要不然在這個步驟加入太多這類強調頭部與上半身的提示詞,會讓AI算不出我需要的人物動作,因為這些提示詞會搶走了AI的注意力。
可以看到,這邊男性與女性的頭髮顏色剛好與我要的相反,手部也有扭曲,臉部更是不及格。但這就是一個很好的起點了。
算圖的第一步,先把Inpaint設置好:
  • Masked content: original
  • Inpaint area: Only masked
  • Denoising strength: 0.75
Inpaint設定
由於0.75的Denoising strength非常高,如果沒有另外的限制,重算出來的人物跟姿勢一定會與草圖相差非常多,這時候我們就要用ControlNet來限制:
ControlNet canny
在第一個ControlNet設定中使用canny。但因為canny會強烈限制住線條,這樣人物出來的長相也不會趨向我LoRA想畫的人物,所以要選擇低權重0.5,並且設定Ending Control Step在0.5,這樣跑到一半時就能放手給LoRA繪製人臉與身體特徵。
在這邊不使用openpose的原因在於,這張圖的人體交纏太過複雜,openpose只會判斷出一團毛線球而已。
ControlNet depth
第二組ControlNet使用depth。depth的功用不只是限制人物的外觀輪廓,同時也提供了物體的立體資訊,可以讓AI算圖時知道哪個肢體是更靠近鏡頭,哪個在後方,這樣重繪出來的人物肢體才不會破碎。但同時又維持0.5的權重,讓AI有機會調整人物的細微部份,尤其是五官的立體形狀。

這些基本設定完成後,我要先從一個角色開始變形,這次就先從女角開始。
用inpaint選取女角之後,將正負面提示詞都換上該角色專用的完整提示詞:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face, beautiful eyes, detailed eyes, perfect body, perfect face,
Hana with black long hair and blunt bangs and white kimono and red short skirt and white cloak and black knee boots
<lora:Hana:0.4>
先選取女角
提示詞內包含了各種精細繪製臉龐,體型,眼睛的正面提示詞,這樣AI才會知道該努力畫臉了。
女角畫完之後檢查,如果不像,可以試著調高LoRA權重,或者成品圖直接輸入inpaint再強化一次。
確定女角夠像之後,接著改選男角,並將提示詞換成男角專用提示詞:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face,
XingBar the strong man with blonde long hair and stubble and wearing grey tunic and grey cloak carrying a girl on his arm
<lora:XingBar:0.4>
圈選男角
依照一樣的步驟,等確認男角也夠像之後,再來考慮精細修改。

精修半成品

還需要打磨的半成品
這時半成品還有很多地方要修正,第一個是明顯扭曲的左手,第二個是高跟的靴子(沒有正常人在荒野冒險還穿這種超高跟靴子!),第三個是人物的臉不夠美觀,表情也不對。
這時需要將問題個別解決,首先要把ControlNet停用,因為整張圖的構圖差不多固定了,不需要再控制免得阻礙。
  • 手的部分,用Inpaint圈選之後用自然語言敘述正面提示詞:left hand of a strong man holding the back of a girl,Denoising strength權重開到0.75。並且跑個十二張圖拼運氣,找出可以接受的成果。
  • 鞋子的部分,我使用了圖片編輯軟體GIMP將鞋跟修掉,用Inpaint選取之後再用正面提示詞:black flat knee high boots,Denoising strength權重開到0.75跑了十張圖,挑選自己喜歡的。
  • 人臉的部分,我將模型切換成我習慣使用於擬真型人物的RealDosMix,將人臉選取起來後用Denoising strength權重0.2到0.3重複算圖,利用漸進算圖法的精神,遇到偏離目標的臉就捨棄,算到更接近目標的就再拿來當作新的輸入。重複到滿意為止。
當整張圖的細節都完成之後,再用img2img配上ControlNet Tile Resample,利用 Stable Diffusion進階 -- 糊臉清晰化 提到的方法打磨整張圖的光影與色彩偏差。然後再用 Stable Diffusion進階 -- 臉崩修復 提到的4x-UltraSharp放大兩倍,提高畫質。
就這樣,一張表情與長相符合我想像,姿勢標準的公主抱圖片就完成了!
祝大家AI算圖愉快!

進階技巧目錄:
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
21.9K會員
380內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
今天來介紹Script中,用來判別提示詞性質,甚至是除錯的好用工具--提示詞矩陣(Prompt matrix)。 身為一個軟體工程師,業界有一句很好玩的俚語: 最可怕的不是搞不懂為何寫出來的程式不能動,而是搞不懂為何寫出來的程式能動。
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
今天來介紹Script中,用來判別提示詞性質,甚至是除錯的好用工具--提示詞矩陣(Prompt matrix)。 身為一個軟體工程師,業界有一句很好玩的俚語: 最可怕的不是搞不懂為何寫出來的程式不能動,而是搞不懂為何寫出來的程式能動。
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
生為人類,男性與女性,在溝通上的不夠精準與誤讀,時常困擾我們,甚至帶來家庭與社會的動盪與困擾。 《打造戀愛腦》是一本帶著大家深入探究男女大腦的差異,理解彼此切入觀察的角度與特性,找到溝通與合作的方式。 一、分歧點 從解剖學看到,男性與女性,在大腦結構的發展上,從青少年開始,出現不同的生理演
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
用Canva「Text to image」製作出帥哥微崩圖,再用Unidream「圖生圖」上傳圖片並輸入文字指示,男生竟然變女生?!修改後,男生能變男生了,細部崩壞無法解決?!咱麼辦呢?「凡事轉個彎,跳脫框架,能創造意想不到的結果」。
Thumbnail
可能包含敏感內容
男女大不同 為了生成貼切原貌的體態『裸體』,這次選用自行安裝的Stable Diffusion生成圖像。 註:以下所生成圖像的裸體之重點部位,均已馬賽克(pixelate)處理。 很久以前,在一個遼闊的海岸邊,有一個美麗的花園,名叫伊甸園...
Thumbnail
本文來分享一些 Openpose 的控制線圖,有需要的朋友,自行運用喔。點選連結,可以直接在 Tensor Art 上看到所使用的模型與提示詞。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
可能包含敏感內容
對方是一對情侶  原本是想說來約同房交換看看  結果變成女生先來單約  既然如此,那就請主人好好開發她囉 先用玩具把她弄到受不了 接著換主人的肉棒進去  把單女弄到咪咪冒冒 女生只對特定姿勢有感  所以整場下來  幾乎都是主人在努力動 於是主人決定試試單女的口技 吃硬再來射一發
Thumbnail
可能包含敏感內容
一個雙手撫弄頭髮的女生... Tensor.Art 連結在此,登入後可以使用 做同款(Remix) 功能產生類似圖片喔(AI 生圖)。 好的,廢話不多說,直接提供 ControlNet 的 Openpose 圖片~
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
生為人類,男性與女性,在溝通上的不夠精準與誤讀,時常困擾我們,甚至帶來家庭與社會的動盪與困擾。 《打造戀愛腦》是一本帶著大家深入探究男女大腦的差異,理解彼此切入觀察的角度與特性,找到溝通與合作的方式。 一、分歧點 從解剖學看到,男性與女性,在大腦結構的發展上,從青少年開始,出現不同的生理演
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
Thumbnail
用Canva「Text to image」製作出帥哥微崩圖,再用Unidream「圖生圖」上傳圖片並輸入文字指示,男生竟然變女生?!修改後,男生能變男生了,細部崩壞無法解決?!咱麼辦呢?「凡事轉個彎,跳脫框架,能創造意想不到的結果」。
Thumbnail
可能包含敏感內容
男女大不同 為了生成貼切原貌的體態『裸體』,這次選用自行安裝的Stable Diffusion生成圖像。 註:以下所生成圖像的裸體之重點部位,均已馬賽克(pixelate)處理。 很久以前,在一個遼闊的海岸邊,有一個美麗的花園,名叫伊甸園...
Thumbnail
本文來分享一些 Openpose 的控制線圖,有需要的朋友,自行運用喔。點選連結,可以直接在 Tensor Art 上看到所使用的模型與提示詞。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
可能包含敏感內容
對方是一對情侶  原本是想說來約同房交換看看  結果變成女生先來單約  既然如此,那就請主人好好開發她囉 先用玩具把她弄到受不了 接著換主人的肉棒進去  把單女弄到咪咪冒冒 女生只對特定姿勢有感  所以整場下來  幾乎都是主人在努力動 於是主人決定試試單女的口技 吃硬再來射一發
Thumbnail
可能包含敏感內容
一個雙手撫弄頭髮的女生... Tensor.Art 連結在此,登入後可以使用 做同款(Remix) 功能產生類似圖片喔(AI 生圖)。 好的,廢話不多說,直接提供 ControlNet 的 Openpose 圖片~