Stable Diffusion基礎 -- 智慧放大功能(Upscale)

更新於 發佈於 閱讀時間約 3 分鐘

本篇要來講述一個使用頻率不輸給文生圖的功能:圖片智慧放大(Upscale)。

這個功能詭異的地方是,他其實是放在Extras這個頁籤裡面。大概這個頁籤原本是要放置各種額外功能,但目前只有智慧放大功能被包括在內。而其他功能都以外掛(Extension)的型態存在於各個頁籤中。

由於AI算圖的尺寸有其極限,通常8GB顯示卡記憶體的情況,當長寬到達1800像素以上時,就很容易算到一半爆炸,且因為Stable Diffusion的圖片訓練尺寸是512或768像素,所以一開始的圖片尺寸太大,反而會造成多胞胎或破圖,所以實際最常用的手法是以512x512或768x512等小圖開始,然後使用Hires. fix把圖拉到兩倍大,再使用img2img或inpaint把圖修整之後,再用Upscale將圖繼續放大兩倍到四倍大。由於Upscale用的演算法不是去噪型的演算法,而是片段地將圖片放大後再拼成大圖,所以記憶體用量相對較小,理論上我們可以把圖片放大8倍,達到4K解析度也毫無問題。

以下是Extras頁面的各項設定:

raw-image

功能分區

  1. 圖片放置區:與圖生圖一樣,可以開啟檔案選擇器或拖曳圖案進去。這邊也提供了批次處理方式在不同頁籤中:
    Single Image:單張圖片。
    Batch Process:批次處理。一樣是選取多張圖,或者拖曳多張圖進來,就可以一次同時處理多張圖。
    Batch from Directory:輸入來源目錄的路徑名,以及目的目錄的路徑名,就可以一次同時把來源目錄的圖都處理了。
  2. 放大或縮小尺寸:指定放大的倍率,有兩種方法:
    Scale by:放大倍率,最小一倍(無縮放),最大八倍。
    Scale to:放大或縮小到規定尺寸,最小可以到64x64,最大可達2048x2048。
  3. 第一與第二放大演算法:我們可以使用最多兩個智慧放大演算法,第一個是預設演算法,第二個演算法還可以用拉桿調整百分比,Automatic1111在最後會將兩個演算法的結果依照比例混合生圖。
  4. 人臉銳利化:Automatic1111提供兩種AI人臉修復演算法,分別是CFPGAN與CodeFormer。這兩種都是修復真人相片的人臉較有效,至於扭曲的AI臉崩現象就無能為力。


下面是一個圖片在智慧放大之前與之後的差別:

raw-image
raw-image

在一樣的展示尺寸之下,可以看到衣服的花紋與髮絲的精細度有差,眼睛的光澤也比較清晰一些。

參照

https://notes.aimodels.fyi/comparing-gfpgan-and-codeformer-a-deep-dive-into-ai-face-restoration/

https://upscale.wiki/wiki/Model_Database

留言
avatar-img
留言分享你的想法!
w yt-avatar-img
2023/07/21
您好可以請教一下,為什麼在使用這個功能的時候,會經常出現error的情況?
子不語-avatar-img
發文者
2023/07/21
w yt 我用這個功能從來沒出過錯誤,可能是顯卡記憶體的問題,如果無法使用這個功能,可以使用看看Multi Diffusion
黑米BR-avatar-img
2023/06/11
黑米BR-avatar-img
2023/06/07
這個功能我個人是覺得實用性不太夠,是解析度已經大到SD老是在亂畫時的折衷辦法。
子不語-avatar-img
發文者
2023/06/07
黑米BR 我很常用,因為我的流程是先生512x768小圖,然後挑好的seed生Hires. fix的1024x1536之後inpaint修圖,修完之後img2img + ControlNet Tile打磨一下,最後upscale兩倍或三倍出大圖。幾乎每張要出的圖都是跑不掉的最後一步
avatar-img
子不語怪・力・亂・神
29.7K會員
432內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
2023/06/20
本篇要來講解一下身為Automatic1111最重要的外掛ControlNet的安裝方法。
Thumbnail
2023/06/20
本篇要來講解一下身為Automatic1111最重要的外掛ControlNet的安裝方法。
Thumbnail
2023/06/14
本篇要來解說Automatic1111這個軟體很重要的一部分,就是外掛(Extension)管理。 外掛是Automatic1111之所以超越玩具與學術研究工具,成為有生產力的軟體的關鍵。
Thumbnail
2023/06/14
本篇要來解說Automatic1111這個軟體很重要的一部分,就是外掛(Extension)管理。 外掛是Automatic1111之所以超越玩具與學術研究工具,成為有生產力的軟體的關鍵。
Thumbnail
2023/06/08
本篇要來講述兩個很少用,而且也會讓人很困惑的小功能,塗鴉(Sketch)與局部塗鴉(Inpaint Sketch)。
Thumbnail
2023/06/08
本篇要來講述兩個很少用,而且也會讓人很困惑的小功能,塗鴉(Sketch)與局部塗鴉(Inpaint Sketch)。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
由於現有顯卡性能限制,想要在圖生圖裡重繪放大一張圖到4k以上的尺寸就得要借用各種分格繪圖再重拼接成大圖的方式,無法一次生成。之前試過大家很推崇的Ultimate SD upscale,但對於我要重繪放大的”真人寫實照片”類型的圖來說,一直出現各種問題........
Thumbnail
由於現有顯卡性能限制,想要在圖生圖裡重繪放大一張圖到4k以上的尺寸就得要借用各種分格繪圖再重拼接成大圖的方式,無法一次生成。之前試過大家很推崇的Ultimate SD upscale,但對於我要重繪放大的”真人寫實照片”類型的圖來說,一直出現各種問題........
Thumbnail
雖然有了文生圖、圖生圖可以負責幫我們畫圖/算圖,但使用文生圖或圖生圖在算圖時,目前依電腦顯卡設備的不同,都有一定的極限值在,想要直接畫出4k、8k或者是16k以上的高清圖又不爆顯存實在有困難。因此我們就需要有能夠把小圖高清放大的功能(Extras頁籤底下的智慧放大-Upscale)。 Extr
Thumbnail
雖然有了文生圖、圖生圖可以負責幫我們畫圖/算圖,但使用文生圖或圖生圖在算圖時,目前依電腦顯卡設備的不同,都有一定的極限值在,想要直接畫出4k、8k或者是16k以上的高清圖又不爆顯存實在有困難。因此我們就需要有能夠把小圖高清放大的功能(Extras頁籤底下的智慧放大-Upscale)。 Extr
Thumbnail
本篇要來講述一個使用頻率不輸給文生圖的功能:圖片智慧放大(Upscale)。 這個功能詭異的地方是,他其實是放在Extras這個頁籤裡面。
Thumbnail
本篇要來講述一個使用頻率不輸給文生圖的功能:圖片智慧放大(Upscale)。 這個功能詭異的地方是,他其實是放在Extras這個頁籤裡面。
Thumbnail
這一篇要來敘述Stable Diffusion的Automatic1111的圖生圖(img2img,簡稱i2i)功能。
Thumbnail
這一篇要來敘述Stable Diffusion的Automatic1111的圖生圖(img2img,簡稱i2i)功能。
Thumbnail
這篇要來詳細解說在文生圖(txt2img)裡面,Hires. fix這個東西到底是用來做什麼,以及他的詳細參數。
Thumbnail
這篇要來詳細解說在文生圖(txt2img)裡面,Hires. fix這個東西到底是用來做什麼,以及他的詳細參數。
Thumbnail
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
Thumbnail
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
Thumbnail
偶而會碰到一種例子,就是在算圖時發現了一個很不錯的全身人物圖,當我將它放大之後,又想要抓個臉部特寫,卻發現人物的臉已經糊掉了。這時我們有個終極方法可以將它清晰化。
Thumbnail
  Stable Diffusion進入Image2Image的放大階段後,很少有算出來的成果是完全滿意的......
Thumbnail
  Stable Diffusion進入Image2Image的放大階段後,很少有算出來的成果是完全滿意的......
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News