更新於 2024/10/12閱讀時間約 4 分鐘

Stable Diffusion練習,夢歌

哈娜與巫娜・莫瑞

哈娜與巫娜・莫瑞

明明才剛認識,卻好像交心許久。
明明連語言都不通,卻可以靠寥寥幾個字與比手畫腳談天說地。
明明文化與外表南轅北轍,但是情感與才思卻如此相通。

她們兩個好像是兩本仕女筆記,互相敞開最害羞的內頁讓對方暢覽。儘管雙方以不同的語言書寫秘密,但頁緣畫滿了各種小花小草小圖示與表情,書寫的筆跡快慢粗細不經意透露了心情與煩惱。

這就是心靈相通的感覺嗎?儘管氤氳水氣冷得哈娜屁股都要結凍了,她依然感覺被幸福醺醉了,臉頰暖烘烘的。

從三月開始到現在,學習AI算圖差不多半年。這半年來,遇過最困難的挑戰,就是如何建構多人構圖。

與單人構圖不同,多人構圖除了要考慮視角、位置、光影、透視與色調等問題,多人肢體與眼神表情的互動也是要考慮的重點。如果需要特定角色,而非隨機角色,那就要使用LoRA來確保人物特徵是正確的。在多人構圖中又會造成LoRA污染其他角色。之前可以使用諸如Composable LoRA(Latent Couple)或者Regional Prompt等外掛插件來幫忙。但是隨著A1111不斷更新,許多插件都中止更新,無法再用。因此,我們必須摸索一些不靠插件,只靠最基本的LoRA加上ControlNet來達到多人圖的手法。

剛好,這半年來跑的各種小說概念插圖裡面,我最滿意的一張圖,就是一張雙人構圖,且只使用了LoRA加上ControlNet來達到的。

這張圖我用在了:

夢歌(四之一) -- Stable Diffusion繪製

夢歌(四之二) -- Stable Diffusion繪製

夢歌(四之三) -- Stable Diffusion繪製

夢歌(四之四) -- Stable Diffusion繪製

之中。

整張圖的建構步驟,可以用下面這個GIF動態檔來簡述:

繪圖過程動態

繪圖步驟

首先,我需要生出一張最基本的雙人openpose姿勢圖,無論是使用人偶App來擺出這樣的姿勢,或者使用真實照片在擷取姿勢都可以,在我的例子裡,我使用真人相片,然後使用dw_openpose_full這個前置處理器來擷取姿勢:

OpenPose姿勢圖

接著使用適當的提示詞,例如2girls。配上ControlNet的openpose來引導AI生出一個姿勢是正確的雙人互動基礎圖:

基礎圖片

接著,由於不想靠任何分區處理外掛來生圖,我將這張基礎圖片換到inpaint裡面繼續加工。先選擇左邊的人物,然後使用針對角色的提示詞以及角色的特定LoRA,將人物轉換成我要的人物。

請記住將ControlNet的openpose也設定好,尤其要注意,因為我已經給了骨架圖,所以前置處理器要設定成none,要不然人物的姿勢會跑掉:

ControlNet的openpose設定

將第一個人物繪製完成後,圖會變成這樣:

左邊人物繪製完畢

依樣畫葫蘆,將右邊的人物也用inpaint換成我們要的角色:

左右兩邊人物都已置換完畢

在重繪時,denoising strength都要保持大概0.75到0.8的高強度,才能順利重繪成完全不同的角色。

接下來是細節處理。我使用inpaint sketch功能:

Stable Diffusion基礎 -- 塗鴉(Sketch)

一樣使用高強度的denoising strength來重繪右邊人物的服裝(從華麗的服裝變成簡單的白袍),以及左邊人物的表情(從露齒笑容變成微笑):

服裝與表情置換完畢

最後,開動繪圖軟體,將背景塗上霧氣以營造符合小說內容的氛圍,再將塗好背景霧氣的圖拿回A1111裡面以低denoising strength重新塗佈,讓整體圖片更一致:

完成圖

接下來剩下的就是繼續修正小細節,例如改變眼珠的位置讓兩人彼此互視(意外地困難!),將圖片放大之後再修正更多不協調之處等小問題。圖片就完成了!

結語

隨著A1111或ComfyUI等AI算圖工具的演進,很多插件外掛作者會因為種種因素而中斷開發,因此在學習AI算圖時,除了依靠插件外掛之外,最好還是學習更多基本功,讓自己可以不依賴插件外掛而作圖。

這也是我為何很少介紹各種插件外掛的原因。很有可能這個版本非常好用的外掛,到了下一個版本之後就不再更新而無法使用。


祝大家AI算圖愉快!

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.