不想老畫出同樣的臉?那就多加幾道功夫吧 - AI繪圖 Stable Diffusion

閱讀時間約 8 分鐘

前言

  已經玩SD好一陣子的人應該已經發現,很多名字帶有「Mix」且比較有名的checkpoint模型基本上就是在互相「抄來抄去」,而且在女角方面很多只使用了極少的人物重點訓練,導致算出來的臉常常「都長一個樣」。
  雖然可以透過使用LoRA模型、Textual Inversion等局部改變風格,然而無論是自己製作的還是他人製作的,往往都參雜了一些副作用在裡頭,例如更加扭曲的手指、太過寫實、太過不寫實等,時不時還會蓋掉所使用的checkpoint模組原本的優點,而且如果一次使用超過一個LoRA/Textual Inversion,它們彼此之間還會「打架」,產生非常難以預判效果的成品。
  所以到底該怎麼辦呢?

現階段而言,人工介入仍非常必要

  最近筆者在做一個30張高解析度(3072*6144)女角畫冊的計畫,因為不想每張的女角看起來都像同一個人,所以摸索出了一些心得:

一、慎選checkpoint模組

  有的checkpoint模組因為作者本身的喜好而非常「固執」,比方說筆者想繪製一張具有非裔臉部特徵的綠皮膚半獸人,先使用SweetMix算出一張384*768的小圖:
SweetMix 384*768,還不賴!
  接著,筆者原本想使用neverendingDreamNED模組來進行Image2Image的第一次2倍放大(768*1536),結果在提示詞保有「Green skin」(綠皮膚)、「Orc」(半獸人)、「thick lips」(厚嘴唇)且使用((加重權重)),並使用ControlNet的tile_resample的情境下,該模組硬是畫出了下面結果:
neverendingDreamNED死都不肯畫出綠皮膚和厚唇
  而筆者最近常用的fantasticMix雖然在CIVITAI上的範例圖也有明顯的女角偏好,但仍成功「解讀」和保有了半獸人的特徵,並成功畫出了非裔特徵的五官:
Good job,fantastic!
  找對幫手,才會事半功倍!

二、手動合併不同Denoising Strength的圖

  然而,筆者會想嘗試使用neverendingDreamNED,是因為fantasticMix在超高解析度(3072*6144)會畫出太多不必要的細節而造成原本沒有的錯誤,尤其在皮膚處理方面特別糟糕
Denoising Strength 0.5 畫出來的超奇怪膝蓋和小腿
  雖然可以調低Denoising Strength來避免過多的細節與錯誤,但會導致其模糊程度細節缺乏度和使用extras放大圖片時相差無幾,而且使用0.5+的Denoising Strength時,fantasticMix常會畫出筆者想要的五官細緻度,所以也無法完全捨棄。
  有鑑於此,原本筆者想在第一、第二放大階段使用沒有這麼強調細節的checkpoint模組,到最後階段再使用fantasticMix收尾,然而正如前段所示,這個嘗試在半獸人主題上以失敗告終。
  那到底該怎麼辦?用Inpaint?——其實手動後製會更有效率。
  在繪圖軟體中手動處理,現階段仍是不可或缺的過程,特別是在處理手、腳、人體錯誤時,與其不停inpaint重算碰運氣,不如手動人工處理更快,而且不需要專業的繪畫技巧,只需要簡單的模糊(blur)、圖層遮罩疊加,以及粗略的手繪。
  以筆者的套圖製作過程為例,在進行3072*6144這個最終放大階段時,會在繪圖軟體中整合不同的Denoising Strength算出的2~4張圖,且有時會再搭配以extras放大2倍的1536*3072圖(*註1&2)或tile_resample的圖(在detected_maps資料夾中),挑選一張筆者認為錯誤度最低的圖為基底,在其上用遮罩疊加其他版本的圖片,並配合調整色調、對比等
筆者使用的是Clip Studio Paint
  另外,筆者通常會在中等解析度階段(768*1536或1536*3072)處理手腳指畸形和臉部的問題,使用粗略的手繪協助SD判讀,進而在放大時算出更理想的成果:
簡單多加幾筆,SD就能算出更佳的成果
  最終成品的縮小版本如下(真正的解析度vocus不支援,敬請期待套圖完成):
1024*2048的縮小版本
*註1:extras的放大(Upscale)請參閱子不語 Stable Diffusion基礎 -- 智慧放大功能(Upscale) 一文。但寫實風的話筆者並不推薦坊間常推的4x-UltraSharp放大演算法,因為該演算法的成果太過「平滑」。筆者使用的放大演算法是4x_NMKD-Superscale-SP_178000_G.pth*此為直接下載連結)
*註2:A1111和Vlad webui的Image2Image在一般情況有解析度硬上限,但在Vlad使用插件「Multi Diffusion」的「Tiled Diffusion」並勾選「Keep input image Size」可突破該硬上限。Multi Diffusion的使用方法請參閱筆者 放大/多道提示詞的好幫手:MultiDiffusion插件 - Stable Diffusion 一文中「好了!開始進入正題」的部分。

三、其他心得彙整

1. ControlNet的tile_resample功能在階段性放大過程中時常扮演重要的角色,但有時會有反效果,會有需要關掉的情況,例如用Inpaint修正手指、五官時。
2. 使用Inpaint時需要關閉MultiDiffusion的Tiled Diffusion和Tiled VAE功能,不然會出錯。
3. 384*768 → 768*1536階段時(初始小圖首次放大2倍)如果使用ControlNet的tile_resample功能,Denoising Strength可放大膽使用0.75→1,個人經驗是成果往往相當好。另一方面,後續放大時Denoising Strength的值基本要在0.5以下才比較容易有好成果。
4. 好比筆者需要使用「Orc」、「green skin」、「thick lips」才能畫出非裔特徵,如果不給種族、膚色、相貌、人物名等相關提示詞,那麼checkpoint模組往往還是會往同一種臉和身形靠攏——而且虛構的種族、相貌、人物的提示詞也常有效果。
5. A1111不確定,但Vlad在Settings>Stable Diffusion選單下有「Apply color correction to img2img results to match original colors.」選項,在放大圖片時會自動套用色調調整。我會同時勾選Settings > Image Options選單中的「Save a copy of image before applying color correction to img2img results」,讓SD同時保留色調整前後的兩張圖,因為有時候調整前的較佳,有時候調整後的較佳。
6. 後續嘗試用不同的checkpoint模型運算超高解析度時,筆者注意到在Denoising Strength 0.5+時基本上都會出現亂畫的問題,這可能是目前SD的極限,因為訓練時使用的圖片解析度大多在768以下,導致SD不曉得該怎麼正確填滿高解析度的圖片。
祝大家算圖愉快!
為什麼會看到廣告
82會員
104內容數
筆者探索AI工具時遇到的難題、解方和雜談,不定期更新。
留言0
查看全部
發表第一個留言支持創作者!
黑米BR的沙龍 的其他內容
NVIDIA驅動程式最新版本532.03   因為NVIDIA驅動程式最新版本532.03據說在Windows 11環境下能大幅提升Stable Diffusion的inference效能(簡單的說即是算圖效能),所以我更新了驅動程式後想測試看看。   先說結論:好像有,又好像沒有,總之希望有。  
因為最近在玩這篇ACG LoRA的寫實風運用 - Stable Diffusion 心得中的內容,所以繼約兒後也嘗試了2B的LoRA。
摸索如何讓AI畫出比較好的手時篩選出的幾張。
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
最近ControlNet再度迎來了一個小更新,這次添加了一種Prepocessor模式「reference_only」。
  Stable Diffusion進入Image2Image的放大階段後,很少有算出來的成果是完全滿意的......
NVIDIA驅動程式最新版本532.03   因為NVIDIA驅動程式最新版本532.03據說在Windows 11環境下能大幅提升Stable Diffusion的inference效能(簡單的說即是算圖效能),所以我更新了驅動程式後想測試看看。   先說結論:好像有,又好像沒有,總之希望有。  
因為最近在玩這篇ACG LoRA的寫實風運用 - Stable Diffusion 心得中的內容,所以繼約兒後也嘗試了2B的LoRA。
摸索如何讓AI畫出比較好的手時篩選出的幾張。
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
最近ControlNet再度迎來了一個小更新,這次添加了一種Prepocessor模式「reference_only」。
  Stable Diffusion進入Image2Image的放大階段後,很少有算出來的成果是完全滿意的......
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
為什麼女性不想結婚?不怕越老越沒人要?這背後其實隱藏著許多不為人知的原因。很多人都是出於社會期待、家人壓力或其他消極因素,而草率地走入婚姻。結婚似乎是人生中不可或缺的一環,不管是交往多年後、年齡壓力或對方父母的催促,都讓許多女性感到有必要結婚。但結婚,不單單只是感情上多了一張有法律效率的紙這麼簡單。
Thumbnail
企業主管和連續殺人犯有著同樣冷靜與冷血的人格特質,精神醫學與犯罪心理學稱為「反社會人格」…啊啊啊!!! 你不要害我得罪人啊!!! (丟書
Thumbnail
我是威力,學生通常叫我卡卡老師或威力老師又或者是沒威力老師。之所以會被叫卡卡老師是因為有一次在發卡片的時候,我就用了疊字「卡卡」這個詞,被一群高年級的學生聽到,他們從此覺得我超級幼稚,所以拿這個來當我的綽號。至於沒威力老師這個稱號的由來,從字面上就可以大概知道理由了。
Thumbnail
續上篇 回到台北後差不多一周,又接到小易的電話。內容大概是說,易媽媽雖然醒了但狀況不怎麼樂觀,整個人睡睡醒醒,而且自從那天短暫甦醒後,意識漸漸不太清楚。聽得我是滿頭霧水,我聽過人會在受創或疲累的時候昏迷,但是在醫院好好的,人醒著醒著卻又暈倒了是怎麼回事? 掐指一算,沒結果;攤開桌巾米一灑,還是沒
Thumbnail
錢不是罪惡,但千萬不能被物質掌控呀呀呀啊~學習如何整理自己的思緒,了解比物質更珍貴的事物😙😉
Thumbnail
小虎的耳朵聽不清楚了,拍手叫喚她,比開口叫她更有回應,雖然小虎有時會裝作沒聽到。她細細的四肢尤其是後肢耐不了太遠的路程,如果意識到我要帶她走上一段路,她會在聊表心意後猛地往家的方向跑,快地讓我很想用心電感應
Thumbnail
當人在面對生命的老化時,有上述不利的因子會出現,這也讓我想起聖嚴法師的一句話:我們必須隨時注意自己的心靈、健康自己的心靈,因為我們不知道什麼時候會遭遇困難與打擊。 可以說年老的不利因子,將使我們把自己個性中的特質、傾向,表露無遺。怎麼樣類型的人在年老時容易憂鬱? 怎麼樣特質的人又能在年老中從容不迫,
最多人放棄的科目應該就是數學了!看著學生總是學習低成就,想一些方法讓他們試著提起一點點的興趣去學習吧!
Thumbnail
正在考慮要不要生小孩的你,除了如何給小孩一個完善的養育環境以外,應該也對於懷孕會不會影響工作這件事情感到煩惱吧!尤其現在很多工作環境其實都很高壓,很多人也會擔心會不會因為工作的關係而影響到胎兒的健康,孕婦如果不能得到充分的休息,要怎麼安心的生小孩呢?本篇就來討論,如果懷孕了,老闆可以用這個理由...
Thumbnail
無意間看了一部讓人難過異常的電影,說的是生命只剩一個的老先生從蘇格蘭北部一路搭巴士往國境之南去,踏上他人生的最後一趟旅程。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
為什麼女性不想結婚?不怕越老越沒人要?這背後其實隱藏著許多不為人知的原因。很多人都是出於社會期待、家人壓力或其他消極因素,而草率地走入婚姻。結婚似乎是人生中不可或缺的一環,不管是交往多年後、年齡壓力或對方父母的催促,都讓許多女性感到有必要結婚。但結婚,不單單只是感情上多了一張有法律效率的紙這麼簡單。
Thumbnail
企業主管和連續殺人犯有著同樣冷靜與冷血的人格特質,精神醫學與犯罪心理學稱為「反社會人格」…啊啊啊!!! 你不要害我得罪人啊!!! (丟書
Thumbnail
我是威力,學生通常叫我卡卡老師或威力老師又或者是沒威力老師。之所以會被叫卡卡老師是因為有一次在發卡片的時候,我就用了疊字「卡卡」這個詞,被一群高年級的學生聽到,他們從此覺得我超級幼稚,所以拿這個來當我的綽號。至於沒威力老師這個稱號的由來,從字面上就可以大概知道理由了。
Thumbnail
續上篇 回到台北後差不多一周,又接到小易的電話。內容大概是說,易媽媽雖然醒了但狀況不怎麼樂觀,整個人睡睡醒醒,而且自從那天短暫甦醒後,意識漸漸不太清楚。聽得我是滿頭霧水,我聽過人會在受創或疲累的時候昏迷,但是在醫院好好的,人醒著醒著卻又暈倒了是怎麼回事? 掐指一算,沒結果;攤開桌巾米一灑,還是沒
Thumbnail
錢不是罪惡,但千萬不能被物質掌控呀呀呀啊~學習如何整理自己的思緒,了解比物質更珍貴的事物😙😉
Thumbnail
小虎的耳朵聽不清楚了,拍手叫喚她,比開口叫她更有回應,雖然小虎有時會裝作沒聽到。她細細的四肢尤其是後肢耐不了太遠的路程,如果意識到我要帶她走上一段路,她會在聊表心意後猛地往家的方向跑,快地讓我很想用心電感應
Thumbnail
當人在面對生命的老化時,有上述不利的因子會出現,這也讓我想起聖嚴法師的一句話:我們必須隨時注意自己的心靈、健康自己的心靈,因為我們不知道什麼時候會遭遇困難與打擊。 可以說年老的不利因子,將使我們把自己個性中的特質、傾向,表露無遺。怎麼樣類型的人在年老時容易憂鬱? 怎麼樣特質的人又能在年老中從容不迫,
最多人放棄的科目應該就是數學了!看著學生總是學習低成就,想一些方法讓他們試著提起一點點的興趣去學習吧!
Thumbnail
正在考慮要不要生小孩的你,除了如何給小孩一個完善的養育環境以外,應該也對於懷孕會不會影響工作這件事情感到煩惱吧!尤其現在很多工作環境其實都很高壓,很多人也會擔心會不會因為工作的關係而影響到胎兒的健康,孕婦如果不能得到充分的休息,要怎麼安心的生小孩呢?本篇就來討論,如果懷孕了,老闆可以用這個理由...
Thumbnail
無意間看了一部讓人難過異常的電影,說的是生命只剩一個的老先生從蘇格蘭北部一路搭巴士往國境之南去,踏上他人生的最後一趟旅程。