如何用 Stable Diffusion 產生高解析度的圖?

更新於 2023/05/19閱讀時間約 4 分鐘
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
目錄

法一:透過 img2img 放大

將 txt2img 算出的圖片送入 img2img ,並輸入一樣的 prompt,如此及能算出高度類似,但細節略為不同的圖片。

img2img 法詳細步驟

在 txt2img 得到適合的結果後,點選 send to img2img
或者將圖片拉到 png info,再點選 send to img2img
跳轉至 img2img tab,調整長寬放大圖片。調整 denoising strength 控制 AI 自由度。
denoising strength 以 0.5 作為臨界值,大於 0.5 表示 Stable Diffusion 算圖自由度越高,與原圖差異越大。反之小於 0.5 AI 自由度下降,與原圖較為相似。
原圖:
透過 img2img 放大
img2img 算圖時拉高 denoising strength 構圖有可能跑掉,我們可以嘗試使用 ControlNet 控制畫面。ControlNet 使用方法將在另一篇文章中介紹。
原圖:
透過 img2img 放大:

img2img 法小結

優點:
  • 因為是透過 Stable Diffusion Model 算圖,除了放大解析度外,還能增加細部細節!
  • 調整 prompt 和 denoising strength,在此階段同時對圖片作更進一步的優化
缺點:
  • 解析度拉越高,所需算圖時間越久,VRAM 也需要更多、甚至會爆顯存,因此提高的解析度有上限(以 google Colab 的 T4 為例,15 GB 的 VRAM 在接近 2000 x 2000 的時候就會爆掉)
  • 是本文篇文章三法中,放大到同等級解析度時最耗費 VRAM 的方法
  • 放大圖片的細節或構圖可能會改變,需要依照經驗調整 denoising strength,或者引入 ControlNet 來解決

法二:透過 AI Upscaler 放大

透過 ESRGAN 等 AI upscaler 的方式將原圖放大,相對於傳統的 upscaler(如 PhotoShop),放大時能夠增加細節,算圖速度也比 img2img 快。

AI Upscaler 詳細步驟

  • 切換到 Extras tab,點選 Single Image,將想放大的圖片丟到 Source 中
  • 調整 Resize 決定放大幾倍。比如說原圖為 512×512,Resize = 2x.....
延伸閱讀
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
4會員
12內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
這篇給新手参考,老手可以自動跳過去。 這邊用永豐金app示範: 1、選類股報價 2、選上櫃 3、往下滑到公司債,點進去 4、所有可轉債列表 5、排序漲幅 這樣是不是很簡單? 工商一下: 訂閱聲明: vocus 付費內容多有免費公開內容供試閱,因此付費成功後無法
Thumbnail
很久以前黑貓曾經在方格子寫了一篇文章 如何把ChatGPT當專屬的塔羅占卜師【黑貓塔羅】|方格子 vocus 最近方格子寄信通知我說這篇文章上了即時精選,剛好搭上 Threads 話題的熱點,來為這篇文章更新一下我最新的看法。 自學塔羅黑貓專欄 如何計算自己的塔羅流年運勢 跟一般算流年會以
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
聽100篇似乎這一早重要與你若近若遠! 【早上精力最好,心最散】 早上稱為大腦的黃金時間,剛起來的你感到放鬆,放鬆讓你想休閒,慢動作做事,可這時段是大腦回復後最好的狀態,這時候的你,在創作,思考方面都為最佳,你千萬不要白白浪費這時段,它能讓你最省時,最高效完成重要的事,若你使用巧當,一天必要做
Thumbnail
你的品牌是否也能夠在產品介紹、行銷廣告文案撰寫中加入一點幽默感呢?充滿幽默感的廣告文案更能吸引注意,增加客戶對品牌的好感度。今天,哈利熊就整理了五個極為幽默的廣告文案例子,希望能激發你的靈感,讓你也想出適合你的品牌的幽默行銷廣告文案!
Thumbnail
據研究人在一次專注的行為,最多只能處理5-9個重點,而70%的人通常只看標題。如何在快速滑過的1-2秒用【問題點=痛點】,引起【想知道方法】的興趣,簡略舉出3種,純以書名來做舉例,繞在三個議題【困難、希望、恐懼】來談。
如何才可以利用降頭令喜歡的對象主動找你?   大家好!我是玄燊師傅,很多人其實有自己喜歡的對象,但往往只是單戀,他有嘗試過去追求這段愛情,但結果往往是以失敗告終。   然後,他們會嘗試用一些偏方去獲得這段感情…   在玄學上,達到這種目的其實有很多不同的方法,這條片主要會教你如何用降頭這方法去達到這
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
這篇給新手参考,老手可以自動跳過去。 這邊用永豐金app示範: 1、選類股報價 2、選上櫃 3、往下滑到公司債,點進去 4、所有可轉債列表 5、排序漲幅 這樣是不是很簡單? 工商一下: 訂閱聲明: vocus 付費內容多有免費公開內容供試閱,因此付費成功後無法
Thumbnail
很久以前黑貓曾經在方格子寫了一篇文章 如何把ChatGPT當專屬的塔羅占卜師【黑貓塔羅】|方格子 vocus 最近方格子寄信通知我說這篇文章上了即時精選,剛好搭上 Threads 話題的熱點,來為這篇文章更新一下我最新的看法。 自學塔羅黑貓專欄 如何計算自己的塔羅流年運勢 跟一般算流年會以
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
聽100篇似乎這一早重要與你若近若遠! 【早上精力最好,心最散】 早上稱為大腦的黃金時間,剛起來的你感到放鬆,放鬆讓你想休閒,慢動作做事,可這時段是大腦回復後最好的狀態,這時候的你,在創作,思考方面都為最佳,你千萬不要白白浪費這時段,它能讓你最省時,最高效完成重要的事,若你使用巧當,一天必要做
Thumbnail
你的品牌是否也能夠在產品介紹、行銷廣告文案撰寫中加入一點幽默感呢?充滿幽默感的廣告文案更能吸引注意,增加客戶對品牌的好感度。今天,哈利熊就整理了五個極為幽默的廣告文案例子,希望能激發你的靈感,讓你也想出適合你的品牌的幽默行銷廣告文案!
Thumbnail
據研究人在一次專注的行為,最多只能處理5-9個重點,而70%的人通常只看標題。如何在快速滑過的1-2秒用【問題點=痛點】,引起【想知道方法】的興趣,簡略舉出3種,純以書名來做舉例,繞在三個議題【困難、希望、恐懼】來談。
如何才可以利用降頭令喜歡的對象主動找你?   大家好!我是玄燊師傅,很多人其實有自己喜歡的對象,但往往只是單戀,他有嘗試過去追求這段愛情,但結果往往是以失敗告終。   然後,他們會嘗試用一些偏方去獲得這段感情…   在玄學上,達到這種目的其實有很多不同的方法,這條片主要會教你如何用降頭這方法去達到這