Stable Diffusion練習,座狼騎兵哈娜

閱讀時間約 4 分鐘
座狼騎兵哈娜(Hana)與胯下的座狼大壞狗狗(Big-Bad-Doggy)

座狼騎兵哈娜(Hana)與胯下的座狼大壞狗狗(Big-Bad-Doggy)

我要一邊騎著這怪物上戰場,然後一邊雙向翻譯小惡鬼語?哈娜覺得額頭冷汗都被一陣風吹得她頭都痛了起來。
「哈娜,妳可以嗎?」香儂教授一邊檢查自己的武裝,一邊盯著狼廄管理員替她的座騎上鞍,一邊還有餘裕轉頭關心哈娜。

我不行啊!我只會四十幾個小惡鬼詞彙,還是「吃飯飯」、「打架架」這種幼幼版的!哈娜在心中哀嚎。

「可以,我可以的。」哈娜展露出無比堅定的眼神點頭回應。

這篇來簡單地講如何使用簡單的inpaint快速做出自己想要的視覺設計圖。

首先,這張圖是為了替小說中的某篇章節而產出的視覺設計,讓我在寫小說時有所參照。感謝這張圖給我的視覺刺激,讓我能順利寫完整段劇情的大綱。

完成的篇章,其一部份貼在座狼騎兵哈娜 -- Stable Diffusion繪製裡。

在設計這張圖時,基本概念是需要一張主角騎在奇幻世界的座狼上,在煙霧瀰漫的背景下跟隨天空的渡鴉展開任務。

整張作品,從一開始使用提示詞製作出原始草稿之後開始,使用inpaint一點一滴將需要的部分改出來,以下是動畫圖片演示:

gif動畫演示

gif動畫演示

簡單說,流程大概是:

使用提示詞將初始圖片跑出來,我總共隨機產生了約五十張的圖,挑選其中一張我認為最符合我需求的圖當作起點。

起始圖

起始圖

這張圖的問題是,狼的腳完全不對,這是馬匹的四肢,狼的四肢應該像這樣:

狼,圖片來源Britannica, Inc.

狼,圖片來源Britannica, Inc.

另外的問題是背景應該要是平原或者森林而非山脈以符合小說的場景,以及座騎上的角色不是我要的。

那首先我從最重要的角色開始解決,在這我使用inpaint將角色整個框起來,然後使用自己的Lora配上服裝的提示詞,以0.7的denoising strength,加上ControlNet OpenPose來固定角色的四肢與頭部,就完成了角色稿:

角色替換完成

角色替換完成

這時,角色的衣著還沒有達到我的要求,短裙應該要是紅色,而腳應該是穿上靴子,最重要的是,手上的韁繩怎麼不見了?

這時候要請出繪圖軟體,例如GIMP來做簡單的圈選,然後將裙子顏色變換成紅色,再將上一張圖的韁繩與黑手套剪下貼上到新的圖上。

完成之後再使用inpaint針對這些部分使用0.3的低denoising strength將圖整合進半成品圖。

接著再針對腳部,用black knee boots這種提示詞,配合0.6的denoising strength來變出靴子:

服裝替換完成

服裝替換完成

接下來,使用ControlNet Canny或者Lineart來固定線條,並且先inpaint裙子後,再inpaint僅圈選臉部,配合角色專屬的Lora,並且選擇Inpaint area: only masked來精細重繪臉部,得到一個臉部細緻化的半成品圖:

臉部細緻化完成

臉部細緻化完成

在視覺傳達的設計上,一張圖會有一個非常重要的點要傳達給讀者,通常是臉部或者動線交匯的地方,在這張圖上就是人物的臉部位置,因此必須精細重繪,讓人眼一眼就能鎖定臉部,並讓讀者藉由臉->狼頭->地面等由上往下的視覺動線來展開圖片

搞定之後,開始依次inpaint圈選大背景,將背景的山脈換成雲霧森林平原等更符合小說需求的場景。

大背景更換後,再inpaint圈選狼的四肢,使用wolf legs配上0.7的denoising strength來玩抽抽樂,看能不能抽到正常的狼腳,在這邊要使用Inpaint area: Whole picture來讓AI知道整個狼的身體位置與姿態,免得做出歪七扭八的肢體。

四肢修正後,再使用繪圖軟體塗上簡單的狼耳(wolf ear),韁繩(rein),飛在空中的渡鴉(flying raven)等部件,之後使用inpaint針對這些零件分次重繪,讓他們足以融入畫面為止:

完成圖

完成圖

最後,送入extra分頁將之放大數倍。由於放大之後可以察覺角色的臉還是不夠精細,就可以使用繪圖軟體,將角色的頭部裁減出一個768x512的子圖片,將該頭部子圖片送回inpaint,針對臉部用0.4到0.6的denoising strength來重繪,再將重繪過的子圖片送回大圖,小心地對準縫合回去:

經過臉部再次精修過的子圖片

經過臉部再次精修過的子圖片

這樣,就完成了一張3400x2300的大圖,並且確保了整個人物的臉部的細緻度。

整張概念設計圖,從第一張原始圖到完成大約花費四小時。

祝大家AI算圖愉快!

18.5K會員
299內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
「哈娜,妳可以嗎?」香儂教授問。 我不行啊!我只會四十幾個小惡鬼詞彙,還是「吃飯飯」、「打架架」這種幼幼版的!哈娜在心中哀嚎。 「可以,我可以的。」哈娜展露出無比堅定的眼神點頭回應。
起先,只有一隻渡鴉繞著林間空地盤旋。牠的翅膀割出一道黑暗的弧線,像在邀請更多同類加入。眨眼間一大群渡鴉如烏雲從四面八方湧來,圍繞著空地形成一道深墨色的圓圈,似乎在回應著某種野性的召喚。
當兩人手指扣在一起後,史卡特拿起桌上的黃布,一抖揚開蓋著兩人的手。 史卡特的人狼爪隔著布蓋在兩人手上,唸道:「依照史卡拉貝的古老習俗,女神的庇佑,在此的議價,只有雙方與神明知曉,成交之後必須忠誠履約,違者將失去比性命還重要的信譽,以及眾神的眷愛。」
小惡鬼慘叫一聲,噴出一道慘綠的血跡,扭曲的身體摔進河水裡。 哈娜吃驚發現自己還活著。 我打贏了?!
芙悠:「畢竟,我們的第一守則是……」 「加入我們,或者受死!」 這,是我與泰洛斯姐妹會的第一次邂逅。我沒有想到這改變了我的一生。
「 芙,芙悠學姊?」哈娜輕聲探問身旁的學姊。 不知是不是書讀得太累,下午的暖陽又太溫柔,芙悠睡得發出如同小貓嗚嗚叫的鼾聲。
「哈娜,妳可以嗎?」香儂教授問。 我不行啊!我只會四十幾個小惡鬼詞彙,還是「吃飯飯」、「打架架」這種幼幼版的!哈娜在心中哀嚎。 「可以,我可以的。」哈娜展露出無比堅定的眼神點頭回應。
起先,只有一隻渡鴉繞著林間空地盤旋。牠的翅膀割出一道黑暗的弧線,像在邀請更多同類加入。眨眼間一大群渡鴉如烏雲從四面八方湧來,圍繞著空地形成一道深墨色的圓圈,似乎在回應著某種野性的召喚。
當兩人手指扣在一起後,史卡特拿起桌上的黃布,一抖揚開蓋著兩人的手。 史卡特的人狼爪隔著布蓋在兩人手上,唸道:「依照史卡拉貝的古老習俗,女神的庇佑,在此的議價,只有雙方與神明知曉,成交之後必須忠誠履約,違者將失去比性命還重要的信譽,以及眾神的眷愛。」
小惡鬼慘叫一聲,噴出一道慘綠的血跡,扭曲的身體摔進河水裡。 哈娜吃驚發現自己還活著。 我打贏了?!
芙悠:「畢竟,我們的第一守則是……」 「加入我們,或者受死!」 這,是我與泰洛斯姐妹會的第一次邂逅。我沒有想到這改變了我的一生。
「 芙,芙悠學姊?」哈娜輕聲探問身旁的學姊。 不知是不是書讀得太累,下午的暖陽又太溫柔,芙悠睡得發出如同小貓嗚嗚叫的鼾聲。
本篇參與的主題策展
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
Thumbnail
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
Thumbnail
這個應用情境可能是,如果你有自己的產品想要以QRcode來行銷,而「文生圖」(txt2img)的結果又無法與你的實際想像契合時,那麼用你的實際產品做為基底的圖生圖(img2img)QRcode就是一個不錯的選項。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
Thumbnail
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
Thumbnail
這個應用情境可能是,如果你有自己的產品想要以QRcode來行銷,而「文生圖」(txt2img)的結果又無法與你的實際想像契合時,那麼用你的實際產品做為基底的圖生圖(img2img)QRcode就是一個不錯的選項。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。