Stable Diffusion練習,友情

更新於 2024/11/14閱讀時間約 3 分鐘
友情

友情

這篇要示範的圖片,主要是展示在AI算圖時,如何克服不常見角度造成的問題。

眾所皆知,AI算圖的模型是靠訓練一大堆不同的圖片得到的。而圖片的型態分佈會影響到該模型產生出的圖片的偏好。大部分受歡迎的模型,都是大量餵食了正面半身或全身照,對於不常見的角度非常缺乏,因此想要直接畫出特殊角度或特殊透視,常常會得到很奇怪的結果。

這次的練習作品「友情」就是這類特殊角度的圖。

兩個角色使用的是Z字型構圖,並轉了四十五度,如果想要用AI靠著提示詞硬上,通常會得到莫名其妙的結果,或者恐怖的破碎人體圖(請勿輕易嘗試,出來的結果都相當獵奇。)

因此,為了達到我想要的構圖,在一開始的步驟上就要盡量使用AI算圖的優勢,再靠簡單的圖片編輯軟體來搞定AI力有未逮的地方。

步驟

首先,使用玩偶軟體或網站製造出躺在地上且向左看的人偶,然後個別生成兩個角色躺在草地上的圖。這邊會使用到關鍵字例如躺在草地上(laying on grassland),從空中鳥瞰(from above),午後陽光(afternoon lighting)等字眼:

哈娜

哈娜

芙悠

芙悠

兩個正常的鳥瞰圖都成功後,就可以將其中一張去背(用去背網站就足夠),然後開啟圖片編輯軟體,將去背人物旋轉一百八十度後貼上另一張圖,完成初稿:

初稿

初稿

可以看到這兩張人物的光影是不協調的,被剪進來的人物因為沒有影子,整個人是浮在圖片上的,我們必須增加光影。

首先,在圖片編輯軟體裡將整張圖旋轉一百八十度,讓沒有影子的人物維持頭上腳下的角度,然後使用圖層,將影子手動加上新的圖層(這邊就要考驗我們平常對於光影的觀察,越好的觀察力,貼出來的影子就越自然),然後將圖層調整成半透明後,丟進StableDiffusion的inpaint,配合ControlNet的canny,以及0.4到0.5的denosing strength,將影子自然地貼服在人物身上:

貼好影子的角色

貼好影子的角色

接下來,在圖片編輯軟體裡面將這張照片旋轉一個任意角度,讓整張構圖變成斜向的Z字型。由於這樣的旋轉會在四個邊造成空白,我們就要拿起畫筆,施展靈魂畫法,塗鴉一個大概,之後再使用AI的高強度重繪(inpaint搭配夠高的denoising strength),將塗鴉的角落一個接一個變成正常的圖片:

還剩兩個角落靈魂塗鴉的半成品

還剩兩個角落靈魂塗鴉的半成品

轉啊轉,轉啊轉

轉啊轉,轉啊轉



當兩個人物遺失的身體部分都補齊之後,就得到完成品了!


後話

這張圖在接近完成時,先給了一些人鑑定,幾乎每個人都說了同一個問題:穿藍色衣服的女生,眼睛不對啊!

專業美術出身的家人馬上指正:眼黑部分太大,超出眼眶了!然後我花了非常久的時間在修理眼睛的大小以及瞳孔看人的角度,才得到一個堪堪自然的眼神,比我弄整個構圖的時間都多。

在不斷的調整中,我深覺AI無法控制眼球。由於AI訓練時吃了太多正眼面對鏡頭的照片與圖片,生成的圖片,人物通常都會不自覺地看向鏡頭。如果使用的是inpaint來重繪眼睛,這個效應就更明顯,使得人類還是得靠自己的手重繪眼睛,才有希望得到一個不看鏡頭,且兩眼正常看著其他東西的圖片。

所以,除了手指腳趾之外,眼神也是一個目前AI難以控制的點。我們這種業餘畫者除了練習砍手指之外,畫眼睛可能也是一個必修項目。


祝大家AI算圖愉快!


avatar-img
21.6K會員
365內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這張圖的規劃是使用單點透視法,配上簡單的三角構圖以及對比配色(亮紅與深綠)來強調人物的存在感與周圍環境的不友善。
從三月開始到現在,學習AI算圖差不多半年。這半年來,遇過最困難的挑戰,就是如何建構多人構圖。
這篇來簡單地講如何使用簡單的inpaint快速做出自己想要的視覺設計圖。 這張圖是為了替小說中的某篇章節而產出的視覺設計,讓我在寫小說時有所參照。感謝這張圖給我的視覺刺激,讓我能順利寫完整段劇情的大綱。
這篇來講一下如何使用複數素材來拼接出一張完整的作品。 這張圖用於我的小說的概念插畫:渡鴉召喚師 -- Stable Diffusion繪製上
本篇要來分享一下如何用之前學到的技巧來製作有透視關係的多人圖。 這張圖用於我自己的小說 哈娜與修的談判的概念插畫,所以對於角色的表情、姿勢與攝影角度有一定的要求,不是光靠提示詞就能輕鬆生成,最省時間的方法就是使用人偶生圖法來產生姿勢固定的圖。
本篇要來分享一個很簡單但是效果非常有趣的提示詞風格,就是上圖所見的公仔風。
這張圖的規劃是使用單點透視法,配上簡單的三角構圖以及對比配色(亮紅與深綠)來強調人物的存在感與周圍環境的不友善。
從三月開始到現在,學習AI算圖差不多半年。這半年來,遇過最困難的挑戰,就是如何建構多人構圖。
這篇來簡單地講如何使用簡單的inpaint快速做出自己想要的視覺設計圖。 這張圖是為了替小說中的某篇章節而產出的視覺設計,讓我在寫小說時有所參照。感謝這張圖給我的視覺刺激,讓我能順利寫完整段劇情的大綱。
這篇來講一下如何使用複數素材來拼接出一張完整的作品。 這張圖用於我的小說的概念插畫:渡鴉召喚師 -- Stable Diffusion繪製上
本篇要來分享一下如何用之前學到的技巧來製作有透視關係的多人圖。 這張圖用於我自己的小說 哈娜與修的談判的概念插畫,所以對於角色的表情、姿勢與攝影角度有一定的要求,不是光靠提示詞就能輕鬆生成,最省時間的方法就是使用人偶生圖法來產生姿勢固定的圖。
本篇要來分享一個很簡單但是效果非常有趣的提示詞風格,就是上圖所見的公仔風。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
Thumbnail
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
Thumbnail
這個應用情境可能是,如果你有自己的產品想要以QRcode來行銷,而「文生圖」(txt2img)的結果又無法與你的實際想像契合時,那麼用你的實際產品做為基底的圖生圖(img2img)QRcode就是一個不錯的選項。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
最近一直在嘗試把一個夢想許久的小說插畫做出來。 我想要做出一個大魄力的畫面,敘述小說女主角大開殺戒的那一瞬間。 測試了三個不同的版本,終於給我做出來了!
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
為了配合小說「烈火之心」試閱章節(四) -- Stable Diffusion繪製 的情節,我需要生成一副高動態的唯美圖樣,為此我使用了幾個技巧做到,就在這邊記錄下來以為後用。
Thumbnail
這篇來談談混合使用各種AI生圖方式,將AI當成素材庫,最後在繪圖軟體中整合排版的經驗談。 這張圖,四美圖,從生成第一張圖到最後拋光,是使用寫「寫作課」筆記時的零碎時間弄的,實際時數大概12小時。
Thumbnail
這個應用情境可能是,如果你有自己的產品想要以QRcode來行銷,而「文生圖」(txt2img)的結果又無法與你的實際想像契合時,那麼用你的實際產品做為基底的圖生圖(img2img)QRcode就是一個不錯的選項。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。