最詳細的 Stable diffusion WebUI 操作教學 – txt2img

更新於 發佈於 閱讀時間約 5 分鐘
本文帶領大家學習如何調整 Stable Diffusion WebUI 上各種參數。我們以 txt2img 為例,帶大家認識基本設定、Sampling method 或 CFG scale 等各種參數調教,以及參數間彼此的影響,讓大家能夠初步上手,熟悉 AI 算圖!
尚未安裝 Stable Diffusion WebUI 的夥伴可以參考上一篇 如何在 M1 Macbook 上跑 Stable Diffusion?,本篇直接進入主題,說明並討論 WebUI 各項參數。

目錄

Stable Diffusion Checkpoint

下拉選單選擇基本算圖模型。當新增 model 時可點按旁邊的 refresh 按紐,讓選單新增選項。
如何下載以及安裝、模型推薦請參考上一篇 如何在 M1 Macbook 上跑 Stable Diffusion? 文末。

Prompt

輸入關鍵字區域,讓 Stable Diffusion 算出你想像中的畫面。
關鍵字下法與模型訓練時使用的關鍵字有關,不同模型所用的 prompt 可能大不相同。有些關鍵字可能模型並不認得,導致結果不如預期。建議可以多多參考 Civitai 各種模型的專頁,從上面擷取範例來使用並作變化。
除了直接下關鍵字,也能使用特殊符號,如小括號 () 來對該關鍵字調整權重,或者中括號 [] 在過程中變換權重。詳細玩法可參考這篇文章的教學。
這邊簡單提示關鍵字方向:
  • 物:畫面中想要呈現的東西,如人物、動物、物品等等。除了告訴 Stable Diffusion 有哪些物品,亦可多加該物的形容詞,如人的穿著、動作、年齡等等描述
  • 地:物體所在地,亦可想像成畫面的背景,讓 Stable Diffusion 知道背景要畫什麼(不然他會自由發揮)
  • 風格:告訴 Stable Diffusion 要以什麼風格呈現圖片,某個畫家?或是照片?需注意的是 不一定 每個模型都有對應風格關鍵詞,有時候直接更換 model 或 LoRA 可能會比較快達成目的
  • 角度:想要「鏡頭」從哪裡拍攝?或是人物視線方向
一開始算出來的圖或許不盡人意,但透過這些原則方向下去組合 Prompt,逐漸迭代出想像中的畫面,也算是一種創作過程 XD。
需注意的是,prompt 會受到資料偏差影響。如 這篇文 中提到,給定藍眼睛和棕色眼睛關鍵詞,畫出來的女性人種也會不同。這是因為資料來源中,藍眼睛大多是歐洲人,棕色眼睛通常是亞洲人導致,因此算圖結果被連帶影響。

Negative Prompt

輸入的字會讓 Stable Diffusion 算圖時, 避免 產生該關鍵字的影像或結果。
通常大家會下 worst quality 、 grayscale 、 low quality 等等關鍵字,增加算出來的圖像品質。或是一些不想出現的元素,如 fused fingers 、 bad anatomy 、 missing fingers 等等。
Civitai 各模型專頁也有列出 negative prompt,仔細看大部分就是那幾個在換,可以參考貼上。

Sampling method

此參數牽涉到模型設計的數學原理,對使用者來說只要大致了解即可。可以簡單想像他是模型計算中,用不同的方法去逼近答案,因此會影響算出的結果和品質。
甚至不同 Sampling method 所需的算圖時間也不一樣。
一般我常用的是 DPM++ 2M Karras、DPM++ SDE Karras 和 Euler。主要是這幾組算法算出來的圖品質比較好,以及大部分模型 demo 圖也是用這幾組參數。大家可以自己多加探索各種選項。

Sampling steps

Stable Diffusion 的原理,可以想成 AI 將一張充滿雜訊的圖(想像古早類比電視沒有訊號的畫面),慢慢 每步 去掉部分雜訊來 畫圖 .....

延伸閱讀

為什麼會看到廣告
avatar-img
4會員
12內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
KodingWork的沙龍 的其他內容
在峇里島旅行,租一台機車是非常方便的交通工具。本文將為你介紹申請國際駕照的流程,以及如何預定和取還機車。另外,我們還會分享一些有趣的小細節,例如如何在峇里島加油,以及推薦的租機車店等。如果你正計畫前往峇里島,不要錯過這篇完整的機車租車攻略!
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
在峇里島旅行,租一台機車是非常方便的交通工具。本文將為你介紹申請國際駕照的流程,以及如何預定和取還機車。另外,我們還會分享一些有趣的小細節,例如如何在峇里島加油,以及推薦的租機車店等。如果你正計畫前往峇里島,不要錯過這篇完整的機車租車攻略!
Stable Diffusion 算圖時,有時算出來的人臉都像是被揍過一樣!這其實是解析度過小的問題,我們可以透過 img2img upscale 加 inpaint 的手法來解決,只需要兩階段,一起來看看怎麼做吧!
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文下方連結的文章,利用Stable Diffusion生成512 * 512大小的圖片。 輸入的文字是 dog flying in space,此模型需輸入英文句子才會準確生成。 參考文獻 連結該作者在Hugging Face公開的模型去做使用。 本文是在Colab上執行。
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
Stable Diffusion 的 Mov2Mov 套件是一個非常強大的工具,讓你可以自動化和簡化視頻轉換過程。這個套件特別適合那些希望在視頻中進行面部替換、添加配件或改變角色外觀的人。這裡是關於這個套件的一些詳細介紹: 功能和優點 自動化視頻轉換: Mov2Mov 可以自動化視頻到
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文下方連結的文章,利用Stable Diffusion生成512 * 512大小的圖片。 輸入的文字是 dog flying in space,此模型需輸入英文句子才會準確生成。 參考文獻 連結該作者在Hugging Face公開的模型去做使用。 本文是在Colab上執行。
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近有空時就在看如何使用AI作圖的方式製作出有魄力的動作與構圖,恰巧在Civitai這個AI作圖網站上找到了一些有趣的人物姿態,因此發想了一些構圖,依照這些構想做出來的圖效果還算可以接受,因此在這邊記錄一下過程與步驟。
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
Stable Diffusion 的 Mov2Mov 套件是一個非常強大的工具,讓你可以自動化和簡化視頻轉換過程。這個套件特別適合那些希望在視頻中進行面部替換、添加配件或改變角色外觀的人。這裡是關於這個套件的一些詳細介紹: 功能和優點 自動化視頻轉換: Mov2Mov 可以自動化視頻到
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面