Stable Diffusion練習,凌空降落

閱讀時間約 3 分鐘
她如一頭獵鷹降落在一窩兔子之間,亮出鷹爪。  「哀嚎吧!」她狂野咆哮。

她如一頭獵鷹降落在一窩兔子之間,亮出鷹爪。 「哀嚎吧!」她狂野咆哮。


前言

最近一直在嘗試把一個夢想許久的小說插畫做出來。

我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。之前嘗試了兩個版本,作業心得分別放在:

照片縫合AI圖

以及

Stable Diffusion練習,英雄落地姿

試做版本一

試做版本一

試做版本二

試做版本二

這兩個版本多少有點觸及我要的場景,但是有好幾個地方我不滿足:

1.動態不夠大,這像是動作已經做完,還未開始下一個動作的靜止狀態,因此給讀者的動態衝擊就不夠大。

2.透視不夠大,第一版基本沒有透視,第二版的透視有,但是還不夠強烈。

3.動作不夠瀟灑,有點拘謹,還沒有那種大開殺戒的灑脫。

4.最重要的是,該場景是女主角從空中衝刺,殺進敵團的一瞬間,所以需要不只女主角一人,還需要許多表情慌張的雜魚陪襯,這樣才能與女主角殺氣露出的氣勢成對比。


而這四項,就是Stable Diffusion 1.5的弱點。

因此在研究了ChatGPT的DALL-E生圖後,這次我再次嘗試這個主題,試著使用ChatGPT生圖,然後用Stable Diffusion後製,獲得了我比較滿意的成果。


方法

首先,我開啟ChatGTP付費版,命令它生成一個高透視高動態的漫畫圖(漫畫圖的構圖通常比寫實風格要靈活、大氣、高動態):

給我一張圖,奇幻風格,成人漫畫風格,一名女刺客從天而降,落在森林中央,旁邊有驚慌的盜匪倒地,由下而上,大魄力,高動態


經過幾輪重試,出來了一張我認為非常符合我需求的圖:

來源圖

來源圖


這時,我開啟繪圖軟體,將圖片尺寸調整成3:2,用塗抹功能將圖片空白處補增,然後用各種手段將畫面中多餘的人全部抹除,調整成如下圖的半成品:

半成品

半成品


接著,使用部分重繪(Inpaint),將女主角圈選起來,使用ControlNet OpenPose輔助,重繪成我要的版本(記得點選Inpaint Area: Only Masked做精細重繪):

OpenPose參考骨架

OpenPose參考骨架


女主角重繪後的半成品

女主角重繪後的半成品


此時手跟腿的部分還是爛掉的,先不管。

此時將臉部用部分重繪框選起來,換成我要的表情(睜大眼,皺眉,發光的藍色眼珠)。

並且再次重繪衣服,使用ControlNet的Canny,將衣服從深紅換色成純黑。

換完之後,針對圖中的每個雜魚角色,使用0.55到0.7的力道重繪,將他們從美漫風換成我要的風格:

人物風格全部轉換後的半成品

人物風格全部轉換後的半成品


下一步則是開啟繪圖軟體,自行重繪手的部分(畢竟都做了這麼多圖了,修個手指越來越不是問題了),並且將武器、刀鞘、白領巾等女主角該有的配件都用之前文章提到的照相片法、剪接大法拉進來,之後用低度重繪的手法調整邊緣與色調:

手與武器、服飾都做好的半成品

手與武器、服飾都做好的半成品


最後就是將森林的背景重新加工,在下半部加上一些速度線以強調動態,如文章開始的圖就完工了!


結語

就算有AI的強大做圖能力,想要引導AI做出自己喜歡的構圖,尤其是這種高動態多人互動的圖,又加上了魚眼大透視,其實超出了Stable Diffusion的能力,畢竟大多數的Stable Diffusion模型都是使用幾種固定的姿勢來訓練,因此不常見的透視與姿態就成了死角。

這次是使用DALL-E來產生第一版的圖,再透過Stable Diffusion的長處轉成我要的角色。

但是諸如手部、武器握法等弱點,還是要靠自學來處理。所幸一回生二回熟,多做幾次,似乎就能抓到一點要訣,讓整體速度提升不少。

以下的人物細部圖,我主要是重繪了左右手,再交給Stable Diffusion來重新優化,然後眼珠部分則是直接手繪,不靠AI(因為AI似乎會做出很奇怪的修正,越修越呆板),讓女主角能看向右下方的敵人:


人物細部圖

人物細部圖

接下來的功課就是要學習如何手繪人物的指甲等細部部分了!

而我終於了結了一個長久以來的心願,可以把這張圖正式納入小說採用圖了!

祝大家AI生圖愉快!



18.4K會員
299內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
  已經玩SD好一陣子的人應該已經發現,很多名字帶有「Mix」且比較有名的checkpoint模型基本上就是在互相「抄來抄去」,而且在女角方面很多只使用了極少的人物重點訓練,導致算出來的臉常常「都長一個樣」。   那麼,該怎麼辦呢?
Thumbnail
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
Thumbnail
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
Thumbnail
這次要介紹的是stable diffusion webui下的一個小型外掛face editor,可以自動把醜臉歪臉修正回來,不論是大臉小臉都適用,使用方面,原則上全照預設值就行,簡單易用。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
  已經玩SD好一陣子的人應該已經發現,很多名字帶有「Mix」且比較有名的checkpoint模型基本上就是在互相「抄來抄去」,而且在女角方面很多只使用了極少的人物重點訓練,導致算出來的臉常常「都長一個樣」。   那麼,該怎麼辦呢?
Thumbnail
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
Thumbnail
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
Thumbnail
這次要介紹的是stable diffusion webui下的一個小型外掛face editor,可以自動把醜臉歪臉修正回來,不論是大臉小臉都適用,使用方面,原則上全照預設值就行,簡單易用。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。