Stable Diffusion練習,這是利息

閱讀時間約 10 分鐘

前言

成品
這次來分享這個作品的製作過程。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。
於是SD會有非常大的機率變成女抱男或肢體混成一團,更別提同時出現好幾隻手或身體腰斬的恐怖情況。而如果是要將兩個人物LoRA同時用在這個圖上,更增加AI算圖的難度。
通常現行SD在處理同畫面多人不同LoRA時,用的技巧是Composable LoRA加上Latent Couple的手段:
但是,這種做法用在人物肢體交錯的圖時,就超出了它的處理能力:
人物區塊分佈
可以很明顯看到,中間的男性切分了左右畫面,女性橫貫在中間將男性分成兩半,同時男性的左手又扶在女性的後腰上,變成一塊孤島。
我曾經試過用Latent Couple畫出這種複雜度的切分圖,結果產生出來的圖非常、非常、非常慘烈。
這次就要來挑戰使用LoRA,ControlNet,inpaint加上img2img來完成這個作品。

生成半成品

首先,因為這張圖牽涉到兩個人物LoRA,我們不能直接使用提示詞加上LoRA來算圖,這樣會得到陰陽人雙胞胎,所以要先從不使用LoRA的草圖來做。
感謝 Fly Angel 同好的提點,其實Stable Diffusion可以很好地理解人類的自然語言,甚至在故意不加上太多負面提示詞的情況,有些模型可以生出非常絢麗的效果。我在這邊就使用了GhostMix加上描述人物與動作的半自然語言,一次產生一百張圖片,從中挑選一張可用的草圖:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres,
one strong man with blonde hair and long hair and wearing white tunic carry a girl on his arms,
the girl has long black hair and wearing white kimono and grey cloak and short red skirt and black knee boots,
the background is a landscape of mountains and forest
草圖
在這裡我故意不用各種精修臉部、身材眼睛等特徵的提示詞,要不然在這個步驟加入太多這類強調頭部與上半身的提示詞,會讓AI算不出我需要的人物動作,因為這些提示詞會搶走了AI的注意力。
可以看到,這邊男性與女性的頭髮顏色剛好與我要的相反,手部也有扭曲,臉部更是不及格。但這就是一個很好的起點了。
算圖的第一步,先把Inpaint設置好:
  • Masked content: original
  • Inpaint area: Only masked
  • Denoising strength: 0.75
Inpaint設定
由於0.75的Denoising strength非常高,如果沒有另外的限制,重算出來的人物跟姿勢一定會與草圖相差非常多,這時候我們就要用ControlNet來限制:
ControlNet canny
在第一個ControlNet設定中使用canny。但因為canny會強烈限制住線條,這樣人物出來的長相也不會趨向我LoRA想畫的人物,所以要選擇低權重0.5,並且設定Ending Control Step在0.5,這樣跑到一半時就能放手給LoRA繪製人臉與身體特徵。
在這邊不使用openpose的原因在於,這張圖的人體交纏太過複雜,openpose只會判斷出一團毛線球而已。
ControlNet depth
第二組ControlNet使用depth。depth的功用不只是限制人物的外觀輪廓,同時也提供了物體的立體資訊,可以讓AI算圖時知道哪個肢體是更靠近鏡頭,哪個在後方,這樣重繪出來的人物肢體才不會破碎。但同時又維持0.5的權重,讓AI有機會調整人物的細微部份,尤其是五官的立體形狀。

這些基本設定完成後,我要先從一個角色開始變形,這次就先從女角開始。
用inpaint選取女角之後,將正負面提示詞都換上該角色專用的完整提示詞:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face, beautiful eyes, detailed eyes, perfect body, perfect face,
Hana with black long hair and blunt bangs and white kimono and red short skirt and white cloak and black knee boots
<lora:Hana:0.4>
先選取女角
提示詞內包含了各種精細繪製臉龐,體型,眼睛的正面提示詞,這樣AI才會知道該努力畫臉了。
女角畫完之後檢查,如果不像,可以試著調高LoRA權重,或者成品圖直接輸入inpaint再強化一次。
確定女角夠像之後,接著改選男角,並將提示詞換成男角專用提示詞:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres, real face, real skin, realistic face, realistic skin, detailed eyes, detailed facial features, detailed clothes features, detailed face,
XingBar the strong man with blonde long hair and stubble and wearing grey tunic and grey cloak carrying a girl on his arm
<lora:XingBar:0.4>
圈選男角
依照一樣的步驟,等確認男角也夠像之後,再來考慮精細修改。

精修半成品

還需要打磨的半成品
這時半成品還有很多地方要修正,第一個是明顯扭曲的左手,第二個是高跟的靴子(沒有正常人在荒野冒險還穿這種超高跟靴子!),第三個是人物的臉不夠美觀,表情也不對。
這時需要將問題個別解決,首先要把ControlNet停用,因為整張圖的構圖差不多固定了,不需要再控制免得阻礙。
  • 手的部分,用Inpaint圈選之後用自然語言敘述正面提示詞:left hand of a strong man holding the back of a girl,Denoising strength權重開到0.75。並且跑個十二張圖拼運氣,找出可以接受的成果。
  • 鞋子的部分,我使用了圖片編輯軟體GIMP將鞋跟修掉,用Inpaint選取之後再用正面提示詞:black flat knee high boots,Denoising strength權重開到0.75跑了十張圖,挑選自己喜歡的。
  • 人臉的部分,我將模型切換成我習慣使用於擬真型人物的RealDosMix,將人臉選取起來後用Denoising strength權重0.2到0.3重複算圖,利用漸進算圖法的精神,遇到偏離目標的臉就捨棄,算到更接近目標的就再拿來當作新的輸入。重複到滿意為止。
當整張圖的細節都完成之後,再用img2img配上ControlNet Tile Resample,利用 Stable Diffusion進階 -- 糊臉清晰化 提到的方法打磨整張圖的光影與色彩偏差。然後再用 Stable Diffusion進階 -- 臉崩修復 提到的4x-UltraSharp放大兩倍,提高畫質。
就這樣,一張表情與長相符合我想像,姿勢標準的公主抱圖片就完成了!
祝大家AI算圖愉快!

進階技巧目錄:
為什麼會看到廣告
18.5K會員
299內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
今天來介紹Script中,用來判別提示詞性質,甚至是除錯的好用工具--提示詞矩陣(Prompt matrix)。 身為一個軟體工程師,業界有一句很好玩的俚語: 最可怕的不是搞不懂為何寫出來的程式不能動,而是搞不懂為何寫出來的程式能動。
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
這個問題困難的地方在於, 這種類型的動作通常不在AI訓練圖的範圍內,所以它對於很多奇幻世界的概念是一無所知的。在這種情況下,創作者與AI其實有點像是在一艘在迷霧中的海洋航行的船。
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
這次要來講一下,如何使用簡單的inpaint與基本的ControlNet來做到幫人物角色穿上服裝的穿衣術以及換衣術。
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
今天來介紹Script中,用來判別提示詞性質,甚至是除錯的好用工具--提示詞矩陣(Prompt matrix)。 身為一個軟體工程師,業界有一句很好玩的俚語: 最可怕的不是搞不懂為何寫出來的程式不能動,而是搞不懂為何寫出來的程式能動。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
ControlNet發布了1.1新版本,新增了許多不同的model,本文介紹運算大圖時非常好用的Tile Resample model。
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
ControlNet發布了1.1新版本,新增了許多不同的model,本文介紹運算大圖時非常好用的Tile Resample model。
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。