ComfyUI 研究 - 增加細節

Wahaha1345

發佈於ComfyUI 研究

2025/01/19 更新2024/01/20 發佈閱讀 4 分鐘

前言

先前藉由加入提示詞控制畫面內容與品質後，發現圖像放大後細節感覺糊糊的，這篇就要來測試幾個增加細節的方法，測試使用的工作流是基於A1111算法的工作流，且使用固定種子。

測試一：加入更多提示詞

下圖是跟之前一樣的提示詞使用A1111算法生成的圖片：

正向提示詞：(masterpiece),(best quality), cat, outdoor,

負向提示詞：(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,

下圖是加入更多提示詞到負向提示詞生成的圖片：

正向提示詞：(masterpiece),(best quality), cat, outdoor,

負向提示詞：(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw, low res, low quality,

下圖是加入更多提示詞到正向提示詞生成的圖片：

正向提示詞：(masterpiece),(best quality), high res, high detailed, cat, outdoor,

負向提示詞：(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,

簡單測試下來，在負向提示詞加入更多提示詞可以提高些許畫質，在正向提示詞加入更多提示詞則可能直接改變畫面構圖，如果想要保持畫面一致性，增加提示詞的做法個人是不太推薦的。

測試二：直接生成更大的圖像

下圖是直接將生成圖像的尺寸從512x512改成1024x1024後生成的結果，可以發現構圖完全不同，而且畫質出現嚴重的降低，顯然這個做法不行。

圖像尺寸(Empty Latent Image)：1024x1024

正向提示詞：(masterpiece),(best quality), cat, outdoor,

負向提示詞：(worst quality:2), (low quality:2), (normal quality:2), text, watermark, nsfw,

測試三：加入LORA

加入LORA的工作流

上圖的工作流中加入了一個節點：

LORALoadeModelOnly

節點的左側小寫model要輸入其他模型，這次的工作流是直接將使用的大模型串接進來，右側大寫MODEL則是要輸出到其他節點，這次直接輸出到KSampler的model輸入點，使用的LORA為more_details，強度設定為1，生成的圖像如下：

可以發現生成的圖像細節變得更加豐富，構圖變化也不大，想要提升畫面細節使用這個方法應該是最簡單的方式。

測試四：將小圖像放大後再次生成(Hire. Fix)

這個測試是搭建一個簡單的放大工作流，然後將測試三生成的圖像輸入到這個工作流中，再一次生成圖片，與WebUI的Hire. Fix是相同功用。

Upscale 工作流

這個放大工作流由以下的Nodes組成：

KSampler
VAE Decode
Preview Image

不使用進階版的KSampler是因為沒有必要，且可以控制denoise(降噪)這項參數，這項參數太低畫面會產生其他雜點，太高會改變構圖，推薦從0.5開始調整。

生成的圖像如下，細節跟著圖像尺寸提升了。

測試五：使用放大模型將小圖像放大

這個測試是搭建一個使用放大模型的工作流，然後將測試三生成的圖像輸入到這個工作流中，使用放大模型直接放大圖像，然後再把圖像縮小到想要的尺寸。

使用放大模型的工作流

這個放大工作流由以下的Nodes組成：

Load Upscale Model
Upscale Image (using Model)
Upscale Image
Preview Image

因為直接使用放大的模型的關係，所以這個工作流沒有使用KSampler對圖像進行重繪，生成的圖像如下圖。

這個圖像的感覺已經過度銳利，這是因為將放大的圖像直接縮小的結果。

小結

這篇測試了幾個方法，如果對細節沒有過度要求的話，使用LORA模型增加細節的方式已經夠用，且工作流還沒有變得過於複雜，如果想要大尺寸高清圖像的話，可以使用測試四跟測試五的方法，至於測試一增加提示詞的方法可以在未確定構圖的時期使用，但會讓提示詞變得更加複雜或是提示詞間產生衝突，測試二的方法則是完全不推薦，因為會受限於大模型訓練時使用的圖像大小，SD 1.x使用的是512x512，SDXL則是1024x1024，超過尺寸畫質會有明顯的降低。

Frank PlazaComfyUI 研究

留言

Frank Plaza

13.9K會員

89內容數

AI的時代已經來臨

Frank Plaza的其他內容

2024/04/06

ComfyUI研究 - 虛實轉換

這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流，還可以幫線稿上色。

2024/04/06

ComfyUI研究 - 虛實轉換

這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流，還可以幫線稿上色。

2024/04/02

ComfyUI研究 - InstantID

測試一下InstantID

2024/04/02

ComfyUI研究 - InstantID

測試一下InstantID

2024/04/01

ComfyUI研究 - IPAdapter FaceID

測試一下 IPAdapter FaceID

2024/04/01

ComfyUI研究 - IPAdapter FaceID

測試一下 IPAdapter FaceID

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

Frank Plaza

ComfyUI 研究 - VideoLinearCFGGuidance

這一篇要測試一下Video Linear CFG Guidance這個節點，在網路上很多的教學影片跟網友分享的工作流中會看到這個節點，據說這個節點不只可以用在生成影片的工作流中，也可以使用在一般的生成圖片工作流中。

#comfyui#stablediffusion#AI繪圖

2024/03/01

Frank Plaza

ComfyUI 研究 - VideoLinearCFGGuidance

#comfyui#stablediffusion#AI繪圖

2024/03/01

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28