ComfyUI 研究 - 增加細節

更新於 發佈於 閱讀時間約 4 分鐘

前言

先前藉由加入提示詞控制畫面內容與品質後,發現圖像放大後細節感覺糊糊的,這篇就要來測試幾個增加細節的方法,測試使用的工作流是基於A1111算法的工作流,且使用固定種子。

測試一:加入更多提示詞

下圖是跟之前一樣的提示詞使用A1111算法生成的圖片:

raw-image




  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


下圖是加入更多提示詞到負向提示詞生成的圖片:

raw-image




  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw, low res, low quality,


下圖是加入更多提示詞到正向提示詞生成的圖片:

raw-image




  • 正向提示詞:(masterpiece),(best quality), high res, high detailed, cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


簡單測試下來,在負向提示詞加入更多提示詞可以提高些許畫質,在正向提示詞加入更多提示詞則可能直接改變畫面構圖,如果想要保持畫面一致性,增加提示詞的做法個人是不太推薦的。


測試二:直接生成更大的圖像

下圖是直接將生成圖像的尺寸從512x512改成1024x1024後生成的結果,可以發現構圖完全不同,而且畫質出現嚴重的降低,顯然這個做法不行。

raw-image



  • 圖像尺寸(Empty Latent Image):1024x1024
  • 正向提示詞:(masterpiece),(best quality), cat, outdoor,
  • 負向提示詞:(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,


測試三:加入LORA

加入LORA的工作流

加入LORA的工作流

上圖的工作流中加入了一個節點:

  • LORALoadeModelOnly
raw-image

節點的左側小寫model要輸入其他模型,這次的工作流是直接將使用的大模型串接進來,右側大寫MODEL則是要輸出到其他節點,這次直接輸出到KSampler的model輸入點,使用的LORA為more_details,強度設定為1,生成的圖像如下:

raw-image

可以發現生成的圖像細節變得更加豐富,構圖變化也不大,想要提升畫面細節使用這個方法應該是最簡單的方式。


測試四:將小圖像放大後再次生成(Hire. Fix)

這個測試是搭建一個簡單的放大工作流,然後將測試三生成的圖像輸入到這個工作流中,再一次生成圖片,與WebUI的Hire. Fix是相同功用。

Upscale 工作流

Upscale 工作流

這個放大工作流由以下的Nodes組成:

  • KSampler
  • VAE Decode
  • Preview Image

不使用進階版的KSampler是因為沒有必要,且可以控制denoise(降噪)這項參數,這項參數太低畫面會產生其他雜點,太高會改變構圖,推薦從0.5開始調整。

生成的圖像如下,細節跟著圖像尺寸提升了。

raw-image


測試五:使用放大模型將小圖像放大

這個測試是搭建一個使用放大模型的工作流,然後將測試三生成的圖像輸入到這個工作流中,使用放大模型直接放大圖像,然後再把圖像縮小到想要的尺寸。

使用放大模型的工作流

使用放大模型的工作流

這個放大工作流由以下的Nodes組成:

  • Load Upscale Model
  • Upscale Image (using Model)
  • Upscale Image
  • Preview Image

因為直接使用放大的模型的關係,所以這個工作流沒有使用KSampler對圖像進行重繪,生成的圖像如下圖。

raw-image

這個圖像的感覺已經過度銳利,這是因為將放大的圖像直接縮小的結果。

小結

這篇測試了幾個方法,如果對細節沒有過度要求的話,使用LORA模型增加細節的方式已經夠用,且工作流還沒有變得過於複雜,如果想要大尺寸高清圖像的話,可以使用測試四跟測試五的方法,至於測試一增加提示詞的方法可以在未確定構圖的時期使用,但會讓提示詞變得更加複雜或是提示詞間產生衝突,測試二的方法則是完全不推薦,因為會受限於大模型訓練時使用的圖像大小,SD 1.x使用的是512x512,SDXL則是1024x1024,超過尺寸畫質會有明顯的降低。

avatar-img
7.3K會員
81內容數
AI的時代已經來臨
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Frank Hsu的沙龍 的其他內容
ComfyUI可以直接將WebUI(A1111算法)生成的圖像拉進介面讀取工作流與提示詞,但是會生成完成不同的圖像,為了讓圖像成果更加接近WebUI(A1111算法)生成的圖像,預設工作流中的部份Nodes需要被替換,且替換完要將一些參數改成A1111。
這篇是以預設工作流為基礎,加入提示詞去控制畫面,目的是控制生成圖像的主題跟提升品質。
這是為了搭建自己想要的工作流而開始的研究工作。
ComfyUI可以直接將WebUI(A1111算法)生成的圖像拉進介面讀取工作流與提示詞,但是會生成完成不同的圖像,為了讓圖像成果更加接近WebUI(A1111算法)生成的圖像,預設工作流中的部份Nodes需要被替換,且替換完要將一些參數改成A1111。
這篇是以預設工作流為基礎,加入提示詞去控制畫面,目的是控制生成圖像的主題跟提升品質。
這是為了搭建自己想要的工作流而開始的研究工作。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
2023年8月,ComfyUI推出了全新介面設計與功能更新,包括優化的前端代碼、每日夜間版本、穩定版本發布等,旨在提升用戶體驗與操作便利性。這篇文章將介紹主要的更新改動、新功能設置及使用者體驗改善,幫助你快速掌握ComfyUI的新變化。還有如何回到舊版介面及其它設定調整,讓使用變得更順手。
Thumbnail
利用文字紀錄,明確寫下自己的採購項目......
Thumbnail
Ae 小技巧:Adjustment Layer 調整圖層 動態後記系列會記錄一些我在製作中的記錄,可能是分解動畫、小技巧、發想、腳本......等等。 每篇都是小短篇,就是補充用的小筆記,沒有前後順序,可跳著閱讀。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
2023年8月,ComfyUI推出了全新介面設計與功能更新,包括優化的前端代碼、每日夜間版本、穩定版本發布等,旨在提升用戶體驗與操作便利性。這篇文章將介紹主要的更新改動、新功能設置及使用者體驗改善,幫助你快速掌握ComfyUI的新變化。還有如何回到舊版介面及其它設定調整,讓使用變得更順手。
Thumbnail
利用文字紀錄,明確寫下自己的採購項目......
Thumbnail
Ae 小技巧:Adjustment Layer 調整圖層 動態後記系列會記錄一些我在製作中的記錄,可能是分解動畫、小技巧、發想、腳本......等等。 每篇都是小短篇,就是補充用的小筆記,沒有前後順序,可跳著閱讀。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。