Stable Diffusion練習,全員靜默!

2023/11/02閱讀時間約 4 分鐘
全員靜默!

全員靜默!

香儂教授瞬間轉身,雙眼放光,泰洛斯短槍在手,想也不想閃電戳出,一擊刺穿來襲者左肩!
「嘎啊——」綠皮小惡鬼的深綠色血液噴出,如同秋雨落在岩石與馬匹上,嚇得馬匹前蹄揚起。
而來襲者狠狠地砸在岩石上,反彈落在地上。這力量大得讓他止不住勢頭,從土路中央彈滾到路旁,再沿著右方陡坡一路哀嚎翻滾下去,消失在密林深草之中。
「埋伏!」香儂教授大喊,反手擲出沾綠血的短槍,直直射向另一隻從樹上跳下來的小惡鬼。
但這小惡鬼輕巧地揮刀格開短槍,敏捷地蹬著樹皮竄到樹幹另一邊,隱藏了起來。「小惡鬼!」修拔出長劍高舉,大喊:「黑旗幫,列陣!」

這篇要示範的圖片,主要是為了小說練習 全員靜默! -- Stable Diffusion繪製 而繪製。

這張圖的規劃是使用單點透視法,配上簡單的三角構圖以及對比配色(亮紅與深綠)來強調人物的存在感與周圍環境的不友善。

老實講,在一個極度不友善且危機四伏的環境中穿著鮮紅色外袍站在高處,跟大聲說「請向我開炮」一樣誇張。

但這就是這個角色「香儂教授」在小說中的個性,非常高調且有本事高調。

而這張圖的目的,就是藉由這個構圖與配色彰顯這個角色的個性在這個劇情中有什麼樣的發揮。

圖片構成

圖片構成

由於Stable Diffusion對於構圖的任意性,要它完成大景深的單點透視構圖,除了使用提示詞然後拼運氣之外,比較有掌握力的方法是使用複合手法,先從中央開始,然後向左右外展(Outpaint)將視野打開。而由於展開後的圖太大,一次將左右邊都外擴的效率很慢,因此我要使用一個在AI生成大圖時常用的手法,就是分切後再拼合的策略。

手法

首先,我使用一系列的提示詞來隨機產圖,主要是想辦法獲得我要的Openpose素材。

使用的關鍵字大概是from above(從上往下的鏡頭),from behind(從人物後方攝影),dynamic pose(動感姿勢),ponytail(馬尾),fantasy(奇幻)等等。

經過幾張圖片生成後,我使用下面這張來當作人物姿勢的素材:

原始素材圖片

原始素材圖片

接著,使用ControlNet的Openpose模型,將提示詞換成我自己提煉的人物LoRA,並將場景更換成in forest(樹林中),serious emotion(嚴肅的表情),midnight(午夜),crescent moon(弦月),mountain background(群山背景)等,將場景乾坤大挪移成晚上的深山老林中。

在做好的圖片上,我還針對臉部與頭髮使用inpaint重繪修臉,並且使用繪圖軟體修手與頭髮,再交給inpaint打磨之後,整張圖片加深色調,變成初步的完成圖:

中央圖片完成

中央圖片完成

之後,為了將整個景的縱深打開,必須將左右部分都做出來,但此時如果直接對這麼大張的圖片使用Outpaint功能加倍圖片的面積,會讓出圖效率變得很慢,更別說出到不滿意的圖要重出,就要花費更多時間。

因此我使用了一個簡單的切割手法,將這張圖片切成左右兩半,然後以純黑背景擴展成兩張完整圖片,再使用inpaint一塊一塊將黑色部分塗出樹林的樣貌:

右半部初始狀態,切割過的圖放在純黑背景上

右半部初始狀態,切割過的圖放在純黑背景上

以上圖為例,開啟一張新的純黑背景圖片之後,將原始圖切分成左右兩半部,右半部貼上去的樣子,此時我會先從右上半開始inpaint,順著樹木的輪廓來框選要重繪的部位,慢慢將黑色的部分填滿。

左半部擴展中,左下角尚未填充

左半部擴展中,左下角尚未填充

以上面這張半成品圖為例,左上已經使用inpaint塗上樹林,左下方還是純粹的黑色背景,此時我就能一次一小塊地控制要生成的部位,只要不滿意就能對這區塊重新刷圖,速度較一次出整張大圖快多了,也穩定多了。

由於重繪的部分都是針對純黑部分,因此在兩張圖片都完成後拼合回來時,中央部分就不會產生任何色差或銜接縫。

當兩張圖片重新拼合為一張後,我再將人物的衣服低度重繪,以符合當初的人物衣著設定,之後再將人物的武器添上,之後交給4X-UltraSharp智慧放大之後,就一切搞定!


後記

Adobe的Firefly也提供類似的部分生成,功能強大且非常直覺:

我相信再過一兩個月,生成式AI將會取代大部分花時無腦的美術雜工,讓設計師與繪師可以更專注在人類更擅長的部分,就是美學、構圖、含義等AI依然需要人類領導的部分。

祝大家AI算圖愉快!

7.8K會員
223內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!