Stable Diffusion進階 -- X/Y/Z plot

閱讀時間約 6 分鐘
❤️
今天來聊一個我覺得是Script(腳本區)裡面最好用,也是最常用,但是有點複雜的進階功能,X/Y/Z plot。

前言

很多時候,我們有許多重複跑圖,但是一次只改一點點的需求,例如你算到了一個你很喜歡的角色形象,想要使用一樣的提示詞,但是一次改一點東西,例如改變髮色比例,更改服裝,更改一些動作,然後製造大量的圖用做訓練LoRA的範例圖。或者單純是想跑出一個你更喜歡的變體。
或者,你剛訓練完一個新版的LoRA,想要比較新舊版之間的差別,例如權重高低時影響畫面的程度,CFG Scale不一樣會造成什麼改變,改變提示詞會不會被新版LoRA覆蓋掉。
在什麼都不知道的情況下,我們只能一張一張生產,等上一張算好之後再手動更改提示詞,然後繼續跑下一張。這種作法不只無聊,也很容易出錯,如果要測量的選項太多還會累死人,消耗時間與熱情。所以Automatic1111非常貼心地幫我們準備了一個功能,讓我們可以一次跑出大量有細小差別的圖,那就是X/Y/Z plot。

用法

X/Y/Z plot是什麼意思?它的XYZ指的是,我們可以最多設定三種方向的變數讓我們跑圖,例如X方向上選擇提示詞,Y方向上選擇Sampling Steps,Z方向上選擇模型,這樣就能測試在不同模型上,不同Sampling Steps對上不同提示詞所造成的影響。
舉一個例子,當我算出了一個猛男戰士之後,想要快速嘗試不同動作加上不同衣著上的表現,我們就可以選擇X方向上是一組動作提示詞,Y方向上是一組衣著的提示詞。
當我們在Script選單選擇X/Y/Z plot之後,會出現這樣的選單:
空白X/Y/Z plot選單
打開X type,裡面有一堆選項,裡面比較常用到的是:
  • Nothing:什麼都不做
  • Steps:訓練步數
  • CFG Scale:CFG程度
  • Prompt S/R:提示詞搜尋並取代
  • Sampler:採樣器
  • Checkpoint name:模型
  • Styles:你儲存的提示詞
這裡面Prompt S/R是最常用,但也是最難理解的選項,它的用法就是用逗號隔開一組提示詞,而第一個提示詞必須符合一個你的正面或負面提示詞,只要它能找到,就會在之後的圖取代這個提示詞。
例如我的正面提示詞中有(resting)這個提示詞,我就能用這樣的Prompt S/R來取代它:
(resting), (sitting), (standing), (fighting), (angry), (riding horse)
於是Automatic1111就能先跑出該角色休息的圖,然後下一張換成坐下的圖,以此類推。
而且X/Y/Z plot並不限制你只能用一次Prompt S/R,所以理論上XYZ三個軸都能用不同的詞來探索。以我的例子,我的X/Y/Z plot會像是這樣:
而我為了讓每次跑的時候出現的圖盡量產生差異,我會勾選Keep-1 for seeds,讓每張圖都使用亂數種子算圖。
當你按下Generate鈕之後,就可以去睡個午覺了,通常一次都可以跑個十幾二十張。等到你回來,Automatic1111會給你一個拼接的預覽圖:
XY軸預覽圖
在這圖上,從左到右是X軸,從上到下是Y軸。 而這些算出來的圖,則是會放在一般圖生圖的目錄內。

LoRA比較

我個人在用X/Y/Z plot時,最常用的情況是在訓練LoRA時。當我們用了不同的素材,不同的參數或不同的程式版本烘焙LoRA的時候,比較新舊版本的優劣,尤其是LoRA在不同模型時能否正確產生我們要的角色,又不會強烈改動模型風格,就是決定人物型LoRA品質的指標,這時候X/Y/Z plot就非常有用。
例如我想要查看我的舊版LoRA與新版LoRA在不同模型下,不同動作的樣子,我就會設定成:
  • X軸:Checkpoint name => 三個不同模型
  • Y軸:Prompt S/R => 五個不同動作
  • Z軸:Prompt S/R => 新的與舊的LoRA,權重都是0.3
下面就是我跑出來的成果:
X/Y/Z軸同時呈現
預覽圖會有兩種版本,檔案較小的JPG檔,和非常巨大但無失真的PNG檔案。要做深度比較的時候,可以開啟PNG檔在大螢幕上仔細比較。
另外,LoRA自己也能跟自己不同權重做比較,讓你找出在不同模型下,哪個權重是甜蜜點:
以不同LoRA權重為Z軸做比較
順帶一提,我的舊版LoRA在權重0.8的時候就全部崩潰了,不管是哪個模型,出來的動作與背景都一樣。這表示舊版的LoRA品質不佳,而在我新訓練的LoRA上就不太會出現這種情形。這就可以讓我有足夠信心了解我的新版LoRA品質較穩定,可以順利取代舊版。

結語

以上就是我常用的X/Y/Z plot情境,希望可以節省大家手動輸入各種設定,無聊等待跑圖出結果,然後又改詞改設定再跑的時間。
祝大家AI算圖愉快!

進階技巧目錄:
為什麼會看到廣告
18.5K會員
299內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
討論如何補救全身肖像下,AI算到崩潰的小臉。
當我在civitai上面逛模組,發現美圖時,都會把這張圖的提示詞複製下來玩玩看。有些圖會有額外的參數,其中最常看到的就是CLIP Skip 2這個東西。
今天來看看我們在使用Stable Diffusion時,常用的幾個網站。
前言 今天來分享如何把一張彩色圖片轉換成一張漫畫風格的黑白線稿的方法。 例如我想把一張水彩稿,或者一張照片轉換成黑白漫畫稿,不只是簡單地把一張圖換成灰階,而是連線條與陰影都要是漫畫風格。
今天要來講的,是如何使用Stable Diffusion來製作角色設定圖。 經過了好幾次的嘗試之後,我找出了一個最穩定出圖,且步驟最少的方法。
討論如何補救全身肖像下,AI算到崩潰的小臉。
當我在civitai上面逛模組,發現美圖時,都會把這張圖的提示詞複製下來玩玩看。有些圖會有額外的參數,其中最常看到的就是CLIP Skip 2這個東西。
今天來看看我們在使用Stable Diffusion時,常用的幾個網站。
前言 今天來分享如何把一張彩色圖片轉換成一張漫畫風格的黑白線稿的方法。 例如我想把一張水彩稿,或者一張照片轉換成黑白漫畫稿,不只是簡單地把一張圖換成灰階,而是連線條與陰影都要是漫畫風格。
今天要來講的,是如何使用Stable Diffusion來製作角色設定圖。 經過了好幾次的嘗試之後,我找出了一個最穩定出圖,且步驟最少的方法。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Generative models have made remarkable strides in recent years, enabling machines to create diverse and realistic content across various domains. Amon
Thumbnail
stable-diffusion-webui AUTOMATIC1111在近期更新到1.6版了,我在本文中列出較重要的8個有感且實用的更新項目。 而那些較為底層的,或是專給高手使用的更新項目我就不細說了。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Generative models have made remarkable strides in recent years, enabling machines to create diverse and realistic content across various domains. Amon
Thumbnail
stable-diffusion-webui AUTOMATIC1111在近期更新到1.6版了,我在本文中列出較重要的8個有感且實用的更新項目。 而那些較為底層的,或是專給高手使用的更新項目我就不細說了。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Vlad Diffusion(下略Vlad)和 Automatic1111(下略A1111)相較: 優點 1. 介面優化 2. 效能優化 -針對 Torch 2.0 優化 -使用 SDP(Scaled Dot Product)優化運算,無須 xFormers 也可顯著提升效能、降低
Thumbnail
  可能是這個問題太過基本,所以網路上幾乎沒有人在提問或回答,但我一開始嘗試Stable Diffusion時,常會遇到一個令我困擾的問題----紫色斑塊。
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。