更新於 2024/09/17閱讀時間約 4 分鐘

Stable Diffusion練習,座狼騎兵哈娜

座狼騎兵哈娜(Hana)與胯下的座狼大壞狗狗(Big-Bad-Doggy)

座狼騎兵哈娜(Hana)與胯下的座狼大壞狗狗(Big-Bad-Doggy)

我要一邊騎著這怪物上戰場,然後一邊雙向翻譯小惡鬼語?哈娜覺得額頭冷汗都被一陣風吹得她頭都痛了起來。
「哈娜,妳可以嗎?」香儂教授一邊檢查自己的武裝,一邊盯著狼廄管理員替她的座騎上鞍,一邊還有餘裕轉頭關心哈娜。

我不行啊!我只會四十幾個小惡鬼詞彙,還是「吃飯飯」、「打架架」這種幼幼版的!哈娜在心中哀嚎。

「可以,我可以的。」哈娜展露出無比堅定的眼神點頭回應。

這篇來簡單地講如何使用簡單的inpaint快速做出自己想要的視覺設計圖。

首先,這張圖是為了替小說中的某篇章節而產出的視覺設計,讓我在寫小說時有所參照。感謝這張圖給我的視覺刺激,讓我能順利寫完整段劇情的大綱。

完成的篇章,其一部份貼在座狼騎兵哈娜 -- Stable Diffusion繪製裡。

在設計這張圖時,基本概念是需要一張主角騎在奇幻世界的座狼上,在煙霧瀰漫的背景下跟隨天空的渡鴉展開任務。

整張作品,從一開始使用提示詞製作出原始草稿之後開始,使用inpaint一點一滴將需要的部分改出來,以下是動畫圖片演示:

gif動畫演示

簡單說,流程大概是:

使用提示詞將初始圖片跑出來,我總共隨機產生了約五十張的圖,挑選其中一張我認為最符合我需求的圖當作起點。

起始圖

這張圖的問題是,狼的腳完全不對,這是馬匹的四肢,狼的四肢應該像這樣:

狼,圖片來源Britannica, Inc.

另外的問題是背景應該要是平原或者森林而非山脈以符合小說的場景,以及座騎上的角色不是我要的。

那首先我從最重要的角色開始解決,在這我使用inpaint將角色整個框起來,然後使用自己的Lora配上服裝的提示詞,以0.7的denoising strength,加上ControlNet OpenPose來固定角色的四肢與頭部,就完成了角色稿:

角色替換完成

這時,角色的衣著還沒有達到我的要求,短裙應該要是紅色,而腳應該是穿上靴子,最重要的是,手上的韁繩怎麼不見了?

這時候要請出繪圖軟體,例如GIMP來做簡單的圈選,然後將裙子顏色變換成紅色,再將上一張圖的韁繩與黑手套剪下貼上到新的圖上。

完成之後再使用inpaint針對這些部分使用0.3的低denoising strength將圖整合進半成品圖。

接著再針對腳部,用black knee boots這種提示詞,配合0.6的denoising strength來變出靴子:

服裝替換完成

接下來,使用ControlNet Canny或者Lineart來固定線條,並且先inpaint裙子後,再inpaint僅圈選臉部,配合角色專屬的Lora,並且選擇Inpaint area: only masked來精細重繪臉部,得到一個臉部細緻化的半成品圖:

臉部細緻化完成

在視覺傳達的設計上,一張圖會有一個非常重要的點要傳達給讀者,通常是臉部或者動線交匯的地方,在這張圖上就是人物的臉部位置,因此必須精細重繪,讓人眼一眼就能鎖定臉部,並讓讀者藉由臉->狼頭->地面等由上往下的視覺動線來展開圖片

搞定之後,開始依次inpaint圈選大背景,將背景的山脈換成雲霧森林平原等更符合小說需求的場景。

大背景更換後,再inpaint圈選狼的四肢,使用wolf legs配上0.7的denoising strength來玩抽抽樂,看能不能抽到正常的狼腳,在這邊要使用Inpaint area: Whole picture來讓AI知道整個狼的身體位置與姿態,免得做出歪七扭八的肢體。

四肢修正後,再使用繪圖軟體塗上簡單的狼耳(wolf ear),韁繩(rein),飛在空中的渡鴉(flying raven)等部件,之後使用inpaint針對這些零件分次重繪,讓他們足以融入畫面為止:

完成圖

最後,送入extra分頁將之放大數倍。由於放大之後可以察覺角色的臉還是不夠精細,就可以使用繪圖軟體,將角色的頭部裁減出一個768x512的子圖片,將該頭部子圖片送回inpaint,針對臉部用0.4到0.6的denoising strength來重繪,再將重繪過的子圖片送回大圖,小心地對準縫合回去:

經過臉部再次精修過的子圖片

這樣,就完成了一張3400x2300的大圖,並且確保了整個人物的臉部的細緻度。

整張概念設計圖,從第一張原始圖到完成大約花費四小時。

祝大家AI算圖愉快!

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.