Stable Diffusion練習,這是利息

更新於 發佈於 閱讀時間約 11 分鐘

前言

raw-image

這次來分享這個作品的製作過程。

像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。

於是SD會有非常大的機率變成女抱男或肢體混成一團,更別提同時出現好幾隻手或身體腰斬的恐怖情況。而如果是要將兩個人物LoRA同時用在這個圖上,更增加AI算圖的難度。

通常現行SD在處理同畫面多人不同LoRA時,用的技巧是Composable LoRA加上Latent Couple的手段:

但是,這種做法用在人物肢體交錯的圖時,就超出了它的處理能力:

raw-image

可以很明顯看到,中間的男性切分了左右畫面,女性橫貫在中間將男性分成兩半,同時男性的左手又扶在女性的後腰上,變成一塊孤島。

我曾經試過用Latent Couple畫出這種複雜度的切分圖,結果產生出來的圖非常、非常、非常慘烈。

這次就要來挑戰使用LoRA,ControlNet,inpaint加上img2img來完成這個作品。

生成半成品

首先,因為這張圖牽涉到兩個人物LoRA,我們不能直接使用提示詞加上LoRA來算圖,這樣會得到陰陽人雙胞胎,所以要先從不使用LoRA的草圖來做。

感謝 Fly Angel 同好的提點,其實Stable Diffusion可以很好地理解人類的自然語言,甚至在故意不加上太多負面提示詞的情況,有些模型可以生出非常絢麗的效果。我在這邊就使用了GhostMix加上描述人物與動作的半自然語言,一次產生一百張圖片,從中挑選一張可用的草圖:

(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres,
one strong man with blonde hair and long hair and wearing white tunic carry a girl on his arms,
the girl has long black hair and wearing white kimono and grey cloak and short red skirt and black knee boots,
the background is a landscape of mountains and forest
raw-image

在這裡我故意不用各種精修臉部、身材眼睛等特徵的提示詞,要不然在這個步驟加入太多這類強調頭部與上半身的提示詞,會讓AI算不出我需要的人物動作,因為這些提示詞會搶走了AI的注意力。

可以看到,這邊男性與女性的頭髮顏色剛好與我要的相反,手部也有扭曲,臉部更是不及格。但這就是一個很好的起點了。

算圖的第一步,先把Inpaint設置好:

  • Masked content: original
  • Inpaint area: Only masked
  • Denoising strength: 0.75
raw-image

由於0.75的Denoising strength非常高,如果沒有另外的限制,重算出來的人物跟姿勢一定會與草圖相差非常多,這時候我們就要用ControlNet來限制:

raw-image

在第一個ControlNet設定中使用canny。但因為canny會強烈限制住線條,這樣人物出來的長相也不會趨向我LoRA想畫的人物,所以要選擇低權重0.5,並且設定Ending Control Step在0.5,這樣跑到一半時就能放手給LoRA繪製人臉與身體特徵。

在這邊不使用openpose的原因在於,這張圖的人體交纏太過複雜,openpose只會判斷出一團毛線球而已。

raw-image

第二組ControlNet使用depth。depth的功用不只是限制人物的外觀輪廓,同時也提供了物體的立體資訊,可以讓AI算圖時知道哪個肢體是更靠近鏡頭,哪個在後方,這樣重繪出來的人物肢體才不會破碎。但同時又維持0.5的權重,讓AI有機會調整人物的細微部份,尤其是五官的立體形狀。


這些基本設定完成後,我要先從一個角色開始變形,這次就先從女角開始。

用inpaint選取女角之後,將正負面提示詞都換上該角色專用的完整提示詞:

(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face, beautiful eyes, detailed eyes, perfect body, perfect face,
Hana with black long hair and blunt bangs and white kimono and red short skirt and white cloak and black knee boots
<lora:Hana:0.4>
raw-image

提示詞內包含了各種精細繪製臉龐,體型,眼睛的正面提示詞,這樣AI才會知道該努力畫臉了。

女角畫完之後檢查,如果不像,可以試著調高LoRA權重,或者成品圖直接輸入inpaint再強化一次。

確定女角夠像之後,接著改選男角,並將提示詞換成男角專用提示詞:

(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face,
XingBar the strong man with blonde long hair and stubble and wearing grey tunic and grey cloak carrying a girl on his arm
<lora:XingBar:0.4>
raw-image

依照一樣的步驟,等確認男角也夠像之後,再來考慮精細修改。

精修半成品

raw-image

這時半成品還有很多地方要修正,第一個是明顯扭曲的左手,第二個是高跟的靴子(沒有正常人在荒野冒險還穿這種超高跟靴子!),第三個是人物的臉不夠美觀,表情也不對。

這時需要將問題個別解決,首先要把ControlNet停用,因為整張圖的構圖差不多固定了,不需要再控制免得阻礙。

  • 手的部分,用Inpaint圈選之後用自然語言敘述正面提示詞:left hand of a strong man holding the back of a girl,Denoising strength權重開到0.75。並且跑個十二張圖拼運氣,找出可以接受的成果。
  • 鞋子的部分,我使用了圖片編輯軟體GIMP將鞋跟修掉,用Inpaint選取之後再用正面提示詞:black flat knee high boots,Denoising strength權重開到0.75跑了十張圖,挑選自己喜歡的。
  • 人臉的部分,我將模型切換成我習慣使用於擬真型人物的RealDosMix,將人臉選取起來後用Denoising strength權重0.2到0.3重複算圖,利用漸進算圖法的精神,遇到偏離目標的臉就捨棄,算到更接近目標的就再拿來當作新的輸入。重複到滿意為止。

當整張圖的細節都完成之後,再用img2img配上ControlNet Tile Resample,利用 Stable Diffusion進階 -- 糊臉清晰化 提到的方法打磨整張圖的光影與色彩偏差。然後再用 Stable Diffusion進階 -- 臉崩修復 提到的4x-UltraSharp放大兩倍,提高畫質。

就這樣,一張表情與長相符合我想像,姿勢標準的公主抱圖片就完成了!

祝大家AI算圖愉快!


進階技巧目錄:

留言
avatar-img
留言分享你的想法!
Pedor Chang-avatar-img
2023/05/14
感覺調整AI繪圖,很不容易。因為很多需要重複實驗和經驗累積。
子不語-avatar-img
發文者
2023/05/14
Pedor Chang 看你的目的,如果是要很精準表達你想的東西,那就要微調很多地方。有時候用繪圖軟體其實更快。
Fly Angel-avatar-img
2023/05/13
給你拍拍手~~~很無私地分享。
子不語-avatar-img
發文者
2023/05/12
這是利息 -- Stable Diffusion繪製提及了這篇文章,趕快過去看看吧!
avatar-img
子不語怪・力・亂・神
30.3K會員
435內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
2024/08/10
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
2024/08/10
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
2024/07/15
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
2024/07/15
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
2024/06/18
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
2024/06/18
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
戀人逆位|存在需要處理的溝通課題 凡是聽過亞當夏娃的故事,當看見戀人牌時,都能直覺聯想到伊甸園的故事。 男女都赤裸著身體,代表坦誠、真實、無所隱瞞。男子受到肉體的吸引,雙眼凝望著女子,順著他的視線可以發現後方隆起的山丘,彷彿性器勃起的姿態;相對的,女子則抬頭仰望著天使,顯示她受到智性
Thumbnail
戀人逆位|存在需要處理的溝通課題 凡是聽過亞當夏娃的故事,當看見戀人牌時,都能直覺聯想到伊甸園的故事。 男女都赤裸著身體,代表坦誠、真實、無所隱瞞。男子受到肉體的吸引,雙眼凝望著女子,順著他的視線可以發現後方隆起的山丘,彷彿性器勃起的姿態;相對的,女子則抬頭仰望著天使,顯示她受到智性
Thumbnail
男女大不同 為了生成貼切原貌的體態『裸體』,這次選用自行安裝的Stable Diffusion生成圖像。 註:以下所生成圖像的裸體之重點部位,均已馬賽克(pixelate)處理。 很久以前,在一個遼闊的海岸邊,有一個美麗的花園,名叫伊甸園...
Thumbnail
男女大不同 為了生成貼切原貌的體態『裸體』,這次選用自行安裝的Stable Diffusion生成圖像。 註:以下所生成圖像的裸體之重點部位,均已馬賽克(pixelate)處理。 很久以前,在一個遼闊的海岸邊,有一個美麗的花園,名叫伊甸園...
Thumbnail
這樣的說法,的確是吻合了。藉以沖淡她那內心無法停止的天性。這種人有辦法赤裸地面對人嗎?我將她抱起,親吻她的脖子,雙手向下延伸,探索她可能會失誤的角落。當兩人都沈浸在這種性愛的誘惑中,總會失誤的吧?
Thumbnail
這樣的說法,的確是吻合了。藉以沖淡她那內心無法停止的天性。這種人有辦法赤裸地面對人嗎?我將她抱起,親吻她的脖子,雙手向下延伸,探索她可能會失誤的角落。當兩人都沈浸在這種性愛的誘惑中,總會失誤的吧?
Thumbnail
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
Thumbnail
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
Thumbnail
明明只是要這個模型給出一點胸部大小正常的女性,然後又在負面提示詞要求他不要出現兒少不宜跟裸露的圖。 但很顯然這個模型要不就是迷幻藥嗑太多,要不就是才剛進叛逆期......
Thumbnail
明明只是要這個模型給出一點胸部大小正常的女性,然後又在負面提示詞要求他不要出現兒少不宜跟裸露的圖。 但很顯然這個模型要不就是迷幻藥嗑太多,要不就是才剛進叛逆期......
Thumbnail
性感 感性 這 不是文字遊戲 不是對比 是真實人性 常駐展示的性感 定格在畫面 視覺易麻痹 驚鴻一瞥的性感 定格在心裡 剎那即是永恆 感性 有層次的性感 撩騷 …. girls have to be strategic 情話 要在右耳輕輕說
Thumbnail
性感 感性 這 不是文字遊戲 不是對比 是真實人性 常駐展示的性感 定格在畫面 視覺易麻痹 驚鴻一瞥的性感 定格在心裡 剎那即是永恆 感性 有層次的性感 撩騷 …. girls have to be strategic 情話 要在右耳輕輕說
Thumbnail
我目不轉睛的看著畫面裏的他們,像是一個充滿期盼的天使,站在上帝的視角,希望他們以一種完美的方式結合。 這一刻,我既無私,又貪婪! 她的腿那麼長,畫了好久才到盡頭,她像是一道柔軟的橋,漸漸拱起一個索命的弧度。 我看得心煩氣躁,不停的大口地灌著啤酒,緩解著喉嚨的不適。 「看興奮了啊,小姐姐?」
Thumbnail
我目不轉睛的看著畫面裏的他們,像是一個充滿期盼的天使,站在上帝的視角,希望他們以一種完美的方式結合。 這一刻,我既無私,又貪婪! 她的腿那麼長,畫了好久才到盡頭,她像是一道柔軟的橋,漸漸拱起一個索命的弧度。 我看得心煩氣躁,不停的大口地灌著啤酒,緩解著喉嚨的不適。 「看興奮了啊,小姐姐?」
Thumbnail
拿出相機和肉條,妳嫣然一笑。
Thumbnail
拿出相機和肉條,妳嫣然一笑。
Thumbnail
很小的時候,受傳統異性戀還有大量的耽美漫畫(!)影響,總以為兩個人交往,就算同性別,攻受分了通常也是不可逆的。直到比較深入了解「現實」同性戀運作的狀態才知道,同性根本就是仗著「你有的我也有、你能做的我也可以做」的心態……
Thumbnail
很小的時候,受傳統異性戀還有大量的耽美漫畫(!)影響,總以為兩個人交往,就算同性別,攻受分了通常也是不可逆的。直到比較深入了解「現實」同性戀運作的狀態才知道,同性根本就是仗著「你有的我也有、你能做的我也可以做」的心態……
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News