2024-08-10|閱讀時間 ‧ 約 8 分鐘

Stable Diffusion練習,凌空降落

她如一頭獵鷹降落在一窩兔子之間,亮出鷹爪。  「哀嚎吧!」她狂野咆哮。

她如一頭獵鷹降落在一窩兔子之間,亮出鷹爪。 「哀嚎吧!」她狂野咆哮。


前言

最近一直在嘗試把一個夢想許久的小說插畫做出來。

我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。之前嘗試了兩個版本,作業心得分別放在:

照片縫合AI圖

以及

Stable Diffusion練習,英雄落地姿

試做版本一

試做版本二

這兩個版本多少有點觸及我要的場景,但是有好幾個地方我不滿足:

1.動態不夠大,這像是動作已經做完,還未開始下一個動作的靜止狀態,因此給讀者的動態衝擊就不夠大。

2.透視不夠大,第一版基本沒有透視,第二版的透視有,但是還不夠強烈。

3.動作不夠瀟灑,有點拘謹,還沒有那種大開殺戒的灑脫。

4.最重要的是,該場景是女主角從空中衝刺,殺進敵團的一瞬間,所以需要不只女主角一人,還需要許多表情慌張的雜魚陪襯,這樣才能與女主角殺氣露出的氣勢成對比。


而這四項,就是Stable Diffusion 1.5的弱點。

因此在研究了ChatGPT的DALL-E生圖後,這次我再次嘗試這個主題,試著使用ChatGPT生圖,然後用Stable Diffusion後製,獲得了我比較滿意的成果。


方法

首先,我開啟ChatGTP付費版,命令它生成一個高透視高動態的漫畫圖(漫畫圖的構圖通常比寫實風格要靈活、大氣、高動態):

給我一張圖,奇幻風格,成人漫畫風格,一名女刺客從天而降,落在森林中央,旁邊有驚慌的盜匪倒地,由下而上,大魄力,高動態


經過幾輪重試,出來了一張我認為非常符合我需求的圖:

來源圖


這時,我開啟繪圖軟體,將圖片尺寸調整成3:2,用塗抹功能將圖片空白處補增,然後用各種手段將畫面中多餘的人全部抹除,調整成如下圖的半成品:

半成品


接著,使用部分重繪(Inpaint),將女主角圈選起來,使用ControlNet OpenPose輔助,重繪成我要的版本(記得點選Inpaint Area: Only Masked做精細重繪):

OpenPose參考骨架


女主角重繪後的半成品


此時手跟腿的部分還是爛掉的,先不管。

此時將臉部用部分重繪框選起來,換成我要的表情(睜大眼,皺眉,發光的藍色眼珠)。

並且再次重繪衣服,使用ControlNet的Canny,將衣服從深紅換色成純黑。

換完之後,針對圖中的每個雜魚角色,使用0.55到0.7的力道重繪,將他們從美漫風換成我要的風格:

人物風格全部轉換後的半成品


下一步則是開啟繪圖軟體,自行重繪手的部分(畢竟都做了這麼多圖了,修個手指越來越不是問題了),並且將武器、刀鞘、白領巾等女主角該有的配件都用之前文章提到的照相片法、剪接大法拉進來,之後用低度重繪的手法調整邊緣與色調:

手與武器、服飾都做好的半成品


最後就是將森林的背景重新加工,在下半部加上一些速度線以強調動態,如文章開始的圖就完工了!


結語

就算有AI的強大做圖能力,想要引導AI做出自己喜歡的構圖,尤其是這種高動態多人互動的圖,又加上了魚眼大透視,其實超出了Stable Diffusion的能力,畢竟大多數的Stable Diffusion模型都是使用幾種固定的姿勢來訓練,因此不常見的透視與姿態就成了死角。

這次是使用DALL-E來產生第一版的圖,再透過Stable Diffusion的長處轉成我要的角色。

但是諸如手部、武器握法等弱點,還是要靠自學來處理。所幸一回生二回熟,多做幾次,似乎就能抓到一點要訣,讓整體速度提升不少。

以下的人物細部圖,我主要是重繪了左右手,再交給Stable Diffusion來重新優化,然後眼珠部分則是直接手繪,不靠AI(因為AI似乎會做出很奇怪的修正,越修越呆板),讓女主角能看向右下方的敵人:


人物細部圖

接下來的功課就是要學習如何手繪人物的指甲等細部部分了!

而我終於了結了一個長久以來的心願,可以把這張圖正式納入小說採用圖了!

祝大家AI生圖愉快!



分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.