2024-01-20|閱讀時間 ‧ 約 26 分鐘

ComfyUI 研究 - 增加細節

前言

先前藉由加入提示詞控制畫面內容與品質後,發現圖像放大後細節感覺糊糊的,這篇就要來測試幾個增加細節的方法,測試使用的工作流是基於A1111算法的工作流,且使用固定種子。

測試一:加入更多提示詞

下圖是跟之前一樣的提示詞使用A1111算法生成的圖片:




  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


下圖是加入更多提示詞到負向提示詞生成的圖片:




  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw, low res, low quality,


下圖是加入更多提示詞到正向提示詞生成的圖片:




  • 正向提示詞:(masterpiece),(best quality), high res, high detailed, cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


簡單測試下來,在負向提示詞加入更多提示詞可以提高些許畫質,在正向提示詞加入更多提示詞則可能直接改變畫面構圖,如果想要保持畫面一致性,增加提示詞的做法個人是不太推薦的。


測試二:直接生成更大的圖像

下圖是直接將生成圖像的尺寸從512x512改成1024x1024後生成的結果,可以發現構圖完全不同,而且畫質出現嚴重的降低,顯然這個做法不行。



  • 圖像尺寸(Empty Latent Image):1024x1024
  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


測試三:加入LORA

加入LORA的工作流

上圖的工作流中加入了一個節點:

  • LORALoadeModelOnly

節點的左側小寫model要輸入其他模型,這次的工作流是直接將使用的大模型串接進來,右側大寫MODEL則是要輸出到其他節點,這次直接輸出到KSampler的model輸入點,使用的LORA為more_details,強度設定為1,生成的圖像如下:

可以發現生成的圖像細節變得更加豐富,構圖變化也不大,想要提升畫面細節使用這個方法應該是最簡單的方式。


測試四:將小圖像放大後再次生成(Hire. Fix)

這個測試是搭建一個簡單的放大工作流,然後將測試三生成的圖像輸入到這個工作流中,再一次生成圖片,與WebUI的Hire. Fix是相同功用。

Upscale 工作流

這個放大工作流由以下的Nodes組成:

  • KSampler
  • VAE Decode
  • Preview Image

不使用進階版的KSampler是因為沒有必要,且可以控制denoise(降噪)這項參數,這項參數太低畫面會產生其他雜點,太高會改變構圖,推薦從0.5開始調整。

生成的圖像如下,細節跟著圖像尺寸提升了。


測試五:使用放大模型將小圖像放大

這個測試是搭建一個使用放大模型的工作流,然後將測試三生成的圖像輸入到這個工作流中,使用放大模型直接放大圖像,然後再把圖像縮小到想要的尺寸。

使用放大模型的工作流

這個放大工作流由以下的Nodes組成:

  • Load Upscale Model
  • Upscale Image (using Model)
  • Upscale Image
  • Preview Image

因為直接使用放大的模型的關係,所以這個工作流沒有使用KSampler對圖像進行重繪,生成的圖像如下圖。

這個圖像的感覺已經過度銳利,這是因為將放大的圖像直接縮小的結果。

小結

這篇測試了幾個方法,如果對細節沒有過度要求的話,使用LORA模型增加細節的方式已經夠用,且工作流還沒有變得過於複雜,如果想要大尺寸高清圖像的話,可以使用測試四跟測試五的方法,至於測試一增加提示詞的方法可以在未確定構圖的時期使用,但會讓提示詞變得更加複雜或是提示詞間產生衝突,測試二的方法則是完全不推薦,因為會受限於大模型訓練時使用的圖像大小,SD 1.x使用的是512x512,SDXL則是1024x1024,超過尺寸畫質會有明顯的降低。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.