AI繪圖-Stable Diffusion 017- 高保真圖像放大?? – StableSR

更新於 發佈於 閱讀時間約 6 分鐘
raw-image

高保真圖像放大??超高清無損?滿滿的細節? – StableSR…….


StableSR 外掛安裝 & 相關模型下載

Step 1 : 安裝StableSR外掛

關於外掛擴充安裝相關,請參考之前文章 : AI繪圖-Stable Diffusion 007- 外掛擴充 Extensions 的安裝、更新、移除與備份

raw-image

Step 2 : 下載模型檔案

StableSR安裝完成後,我們還需要再把運作StableSR所需的Checkpoints模型檔案 & StableSR模組下載放入相應的資料夾裡才能開始使用。

  • Checkpoints模型 (Stable Diffusion V2.1 768 EMA checkpoint (~5.21GB)) :
    從HuggingFace網址下載 : HuggingFace
    檔案下載後放進資料夾路徑 :  …….\models\Stable-diffusion
  • StableSR模組(webui_768v_139.ckpt) :
    從HuggingFace網址下載 : HuggingFace_StableSR Module
    檔案下載後放進資料夾路徑 :  …….\extensions\sd-webui-stablesr\models

 

Step 3 : 下載官方建議搭配使用的其它外掛或是VAE模型(自選,非必要)

 

StableSR 操作介面 & 使用設定注意事項

完成所有安裝與所需模型檔案下載後,在圖生圖功能頁下的的Script(腳本)處就會看到多出了 StableSR的選項

raw-image
  • SR Model : 這邊就是之前下載的StableSR模組 – webui_768v_139.ckpt
  • Scale Factor : 圖片放大倍數。(啟用StableSR後,其它地方圖片尺寸的設定都會無效)
  • Color Fix : 在使用StableSR與分格繪圖(ex. Tiled Diffusion)時很容易會產色顏色偏移,所以需開啟Color Fix。一共有2個選項(Wavelet、AdaIN),這邊官網建議使用Wavelet算法的效果比較好。
  • Pure Noise : Pure Noise開啟時,SD會無視重繪幅度,最終生成一張更具細節的圖片。Pure Noise沒開啟時,即使重繪幅度設置到最大值1,最後圖片也不會完全達到重繪幅度1原本會有的細節呈度(這樣也許對成像效果反而在美感上更理想),而在Pure Noise沒開啟時,官方建議重繪幅度設置成1。


操作注意/建議事項 :

  1. 注意Checkpoint要選擇指定的大模型 ,而SD VAE雖然並不一定要用官網提供的,但既然官網有另提供,還選擇官網推薦的來用。
  2. 圖生圖的採樣方法(Sampling method)建議使用 : Euler a,  CFG Scale=7, 採樣步數(Sampling steps) >= 20
  3. 官網實測建議,加上Negative prompts有助於成像品質(ex. 3d, cartoon, anime, sketches, (worst quality:2), (low quality:2)),而正向提示詞(Prompts)的幫助不大,但可能也有些許作用(ex. (masterpiece:2), (best quality:2), (realistic:2),(very clear:2))
  4. 生成的圖片尺寸> 512時,建議搭配使用Tiled Diffusion & VAE,不然成像畫質會變差。(真的會變很差……根本Tiled Diffusion & VAE就是必用的搭配吧?)
    (關於Tiled Diffusion & VAE安裝與使用方法,可參考之前文章 : AI繪圖-Stable Diffusion 016- Tiled Diffusion with Tiled VAE)
    在搭配StableSR使用時,Tiled Diffusion的設定官方建議如下 :
    Method = Mixture of Diffusers :
    Latent tile size = 96, Latent tile overlap = 48
    Latent tile batch size : 愈大愈好,只要不會到爆顯存就行。
    Upscaler處要選擇”none” (因為不需要在這裡放大,放大的作業是會在StableSR處進行)
raw-image

一切設定完成後,就把圖放進圖生圖視窗開始算圖吧~

 

StableSR 圖像放大實測

見鬼了,我已經完全照官網的參數來設置,網上找到的教學也是一樣模一樣的設置,唯一差別就只是我用的是真人寫實照片,比較不是用二次元或是2.5D動畫照片。但說好的”高保真”放大呢?、超高清無損?滿滿的細節?

這個外掛也說Suitable for most images (Realistic or Anime, Photography or….)

唉~算了,都花時間安裝/下載一些要配對的模型檔案了,還是把結果都記錄一下吧,之後再來卸安裝刪除,別浪費空間和增加SD運行的負擔。

512×768 放大4倍 :

raw-image

還只是放大4倍,原以為那2倍就好,一次放大小一點,結果也是沒差多少,就是寫實照片變得很平貼,然後畫面加上滿滿的顆粒狀紋理/artifacts/畫壞的各種小區塊…..。

PS. 512×768 放大4倍,如果沒搭配Tiled Diffusion with tiled VAE的話會長這樣 :

raw-image

 

最後實在好奇,照著大家教學用的二次元/2.5D動漫圖是不是效果就會有差 :

用二次元的圖來試就沒像真人照片效果慘烈,但也沒好到多驚豔的地步,StableSR相對要多一些下載的檔案和設定,結果效果也沒變比較好………..

(下圖對比為原圖768×768放大4倍(3072×3072),有啟用Pure Noise效細節效果會比沒啟用Denoising設置1的更好一些)

raw-image

 

好了,StableSR這個外掛全用官網建議的參數設定就問題一堆,我也懶得再多花時間去做更多的參數調整測試了。之後如果有人有試用出更好的效果,可以的話,再麻煩好心跟我說一聲到底是哪裡出問題了~~~

記錄店小二建立網賺被動收入歷程、自我學習成長以及各類財富自由資訊的分享專區。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
由於現有顯卡性能限制,想要在圖生圖裡重繪放大一張圖到4k以上的尺寸就得要借用各種分格繪圖再重拼接成大圖的方式,無法一次生成。之前試過大家很推崇的Ultimate SD upscale,但對於我要重繪放大的”真人寫實照片”類型的圖來說,一直出現各種問題........
關於Tile模型,在網路上普遍的教學說法就是它可以”增加畫面細節”、”高清修復放大”,有多神多好用,用了它會讓原圖畫面變更細緻/精緻….等等。但一開始看了很多Youtube上對於tile的教學,我整個印象就是沒能有一個貫通的邏輯性有很明確的指出Tile到底對SD起到的約束/影響是什麼.....
ControlNet的Inpaint主要功能和我們過去圖生圖裡的Inpaint局部重繪大致是一樣的作用,而其中一個預處理器(inpaint_only_lama)還可以產出不錯的背景填充延伸圖(Outpainting)。
ControlNet 官方的其它特殊效果主要有 Shuffle、Tile、Inpaint、IP2P、Reference,其中Tile和Inpaint會花比較多篇幅就之後另外再介紹,這篇就先來看Shuffle & IP2P & Reference這三種ControlNet成像效果。 Shuffl
語義分割(Semantic Segmentation)指的就是針對畫面中每個像素點進行辨別分類(山、河流、人、車、沙發….等),並將同一類型的區域分塊標註成特定顏色。而ControlNet的控制約束裡就有這一項功能。
ControlNet的OpenPose是一開始最主要引起大家關注的一項約束類型。透過提取出原圖中人物的動作姿勢骨架圖,讓我們可以更精準地做到對成像人物姿勢的掌控,即使是一些光靠文字描述也形容不出的動作姿勢,也能輕易實現。 OpenPose 預處理器 & 實例 OpenPose目前的預處理器有
由於現有顯卡性能限制,想要在圖生圖裡重繪放大一張圖到4k以上的尺寸就得要借用各種分格繪圖再重拼接成大圖的方式,無法一次生成。之前試過大家很推崇的Ultimate SD upscale,但對於我要重繪放大的”真人寫實照片”類型的圖來說,一直出現各種問題........
關於Tile模型,在網路上普遍的教學說法就是它可以”增加畫面細節”、”高清修復放大”,有多神多好用,用了它會讓原圖畫面變更細緻/精緻….等等。但一開始看了很多Youtube上對於tile的教學,我整個印象就是沒能有一個貫通的邏輯性有很明確的指出Tile到底對SD起到的約束/影響是什麼.....
ControlNet的Inpaint主要功能和我們過去圖生圖裡的Inpaint局部重繪大致是一樣的作用,而其中一個預處理器(inpaint_only_lama)還可以產出不錯的背景填充延伸圖(Outpainting)。
ControlNet 官方的其它特殊效果主要有 Shuffle、Tile、Inpaint、IP2P、Reference,其中Tile和Inpaint會花比較多篇幅就之後另外再介紹,這篇就先來看Shuffle & IP2P & Reference這三種ControlNet成像效果。 Shuffl
語義分割(Semantic Segmentation)指的就是針對畫面中每個像素點進行辨別分類(山、河流、人、車、沙發….等),並將同一類型的區域分塊標註成特定顏色。而ControlNet的控制約束裡就有這一項功能。
ControlNet的OpenPose是一開始最主要引起大家關注的一項約束類型。透過提取出原圖中人物的動作姿勢骨架圖,讓我們可以更精準地做到對成像人物姿勢的掌控,即使是一些光靠文字描述也形容不出的動作姿勢,也能輕易實現。 OpenPose 預處理器 & 實例 OpenPose目前的預處理器有
你可能也想看
Google News 追蹤
Thumbnail
本文下方連結的文章,利用Stable Diffusion生成512 * 512大小的圖片。 輸入的文字是 dog flying in space,此模型需輸入英文句子才會準確生成。 參考文獻 連結該作者在Hugging Face公開的模型去做使用。 本文是在Colab上執行。
Thumbnail
VQGAN是一種基於GAN(生成對抗式網路)的生成式模型,可以創造新的、逼真的圖像或修改已有圖像。本論文介紹了改進VQGAN用於StableDiffusion中的新方法架構,並提出了一種新的非對稱式VQGAN,具有更強的解碼器和兩個設計條件解碼器。論文下方另附相關資料連結。
Thumbnail
Stable Diffusion 的 Mov2Mov 套件是一個非常強大的工具,讓你可以自動化和簡化視頻轉換過程。這個套件特別適合那些希望在視頻中進行面部替換、添加配件或改變角色外觀的人。這裡是關於這個套件的一些詳細介紹: 功能和優點 自動化視頻轉換: Mov2Mov 可以自動化視頻到
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
隨著人工智能技術的發展,AI 繪圖已經變得常見。Fast Stable Diffusion XL on TPUv5e 是在 Hugging Face 平臺上建立的演示模型,使用 TPU v5e 運行 SDXL 模型,大幅提高了圖像生成速度,生成一張 1024x1024 圖像只需約 10 秒。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
Thumbnail
這個地址可以讓我一鍵安裝目前所有的開源AI應用,包括: AI繪圖工具:Stable Diffusion的Web UI和comyUI 視訊換臉工具:Face Fusion 聲音課程工具:RVC和XTDS 記住這個地址,它可以讓你一鍵安裝目前所有的開源AI應用。不用管環境配置需要哪一個,直接點擊
Thumbnail
本文下方連結的文章,利用Stable Diffusion生成512 * 512大小的圖片。 輸入的文字是 dog flying in space,此模型需輸入英文句子才會準確生成。 參考文獻 連結該作者在Hugging Face公開的模型去做使用。 本文是在Colab上執行。
Thumbnail
VQGAN是一種基於GAN(生成對抗式網路)的生成式模型,可以創造新的、逼真的圖像或修改已有圖像。本論文介紹了改進VQGAN用於StableDiffusion中的新方法架構,並提出了一種新的非對稱式VQGAN,具有更強的解碼器和兩個設計條件解碼器。論文下方另附相關資料連結。
Thumbnail
Stable Diffusion 的 Mov2Mov 套件是一個非常強大的工具,讓你可以自動化和簡化視頻轉換過程。這個套件特別適合那些希望在視頻中進行面部替換、添加配件或改變角色外觀的人。這裡是關於這個套件的一些詳細介紹: 功能和優點 自動化視頻轉換: Mov2Mov 可以自動化視頻到
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
隨著人工智能技術的發展,AI 繪圖已經變得常見。Fast Stable Diffusion XL on TPUv5e 是在 Hugging Face 平臺上建立的演示模型,使用 TPU v5e 運行 SDXL 模型,大幅提高了圖像生成速度,生成一張 1024x1024 圖像只需約 10 秒。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
Thumbnail
這個地址可以讓我一鍵安裝目前所有的開源AI應用,包括: AI繪圖工具:Stable Diffusion的Web UI和comyUI 視訊換臉工具:Face Fusion 聲音課程工具:RVC和XTDS 記住這個地址,它可以讓你一鍵安裝目前所有的開源AI應用。不用管環境配置需要哪一個,直接點擊