Stable Diffusion進階 -- X/Y/Z plot

更新於 發佈於 閱讀時間約 7 分鐘
❤️

❤️

今天來聊一個我覺得是Script(腳本區)裡面最好用,也是最常用,但是有點複雜的進階功能,X/Y/Z plot。

前言

很多時候,我們有許多重複跑圖,但是一次只改一點點的需求,例如你算到了一個你很喜歡的角色形象,想要使用一樣的提示詞,但是一次改一點東西,例如改變髮色比例,更改服裝,更改一些動作,然後製造大量的圖用做訓練LoRA的範例圖。或者單純是想跑出一個你更喜歡的變體。

或者,你剛訓練完一個新版的LoRA,想要比較新舊版之間的差別,例如權重高低時影響畫面的程度,CFG Scale不一樣會造成什麼改變,改變提示詞會不會被新版LoRA覆蓋掉。

在什麼都不知道的情況下,我們只能一張一張生產,等上一張算好之後再手動更改提示詞,然後繼續跑下一張。這種作法不只無聊,也很容易出錯,如果要測量的選項太多還會累死人,消耗時間與熱情。所以Automatic1111非常貼心地幫我們準備了一個功能,讓我們可以一次跑出大量有細小差別的圖,那就是X/Y/Z plot。

用法

X/Y/Z plot是什麼意思?它的XYZ指的是,我們可以最多設定三種方向的變數讓我們跑圖,例如X方向上選擇提示詞,Y方向上選擇Sampling Steps,Z方向上選擇模型,這樣就能測試在不同模型上,不同Sampling Steps對上不同提示詞所造成的影響。

舉一個例子,當我算出了一個猛男戰士之後,想要快速嘗試不同動作加上不同衣著上的表現,我們就可以選擇X方向上是一組動作提示詞,Y方向上是一組衣著的提示詞。

當我們在Script選單選擇X/Y/Z plot之後,會出現這樣的選單:

空白X/Y/Z plot選單

空白X/Y/Z plot選單

打開X type,裡面有一堆選項,裡面比較常用到的是:

  • Nothing:什麼都不做
  • Steps:訓練步數
  • CFG Scale:CFG程度
  • Prompt S/R:提示詞搜尋並取代
  • Sampler:採樣器
  • Checkpoint name:模型
  • Styles:你儲存的提示詞

這裡面Prompt S/R是最常用,但也是最難理解的選項,它的用法就是用逗號隔開一組提示詞,而第一個提示詞必須符合一個你的正面或負面提示詞,只要它能找到,就會在之後的圖取代這個提示詞。

例如我的正面提示詞中有(resting)這個提示詞,我就能用這樣的Prompt S/R來取代它:

(resting), (sitting), (standing), (fighting), (angry), (riding horse)

於是Automatic1111就能先跑出該角色休息的圖,然後下一張換成坐下的圖,以此類推。

而且X/Y/Z plot並不限制你只能用一次Prompt S/R,所以理論上XYZ三個軸都能用不同的詞來探索。以我的例子,我的X/Y/Z plot會像是這樣:

raw-image

而我為了讓每次跑的時候出現的圖盡量產生差異,我會勾選Keep-1 for seeds,讓每張圖都使用亂數種子算圖。

當你按下Generate鈕之後,就可以去睡個午覺了,通常一次都可以跑個十幾二十張。等到你回來,Automatic1111會給你一個拼接的預覽圖:

XY軸預覽圖

XY軸預覽圖

在這圖上,從左到右是X軸,從上到下是Y軸。 而這些算出來的圖,則是會放在一般圖生圖的目錄內。

LoRA比較

我個人在用X/Y/Z plot時,最常用的情況是在訓練LoRA時。當我們用了不同的素材,不同的參數或不同的程式版本烘焙LoRA的時候,比較新舊版本的優劣,尤其是LoRA在不同模型時能否正確產生我們要的角色,又不會強烈改動模型風格,就是決定人物型LoRA品質的指標,這時候X/Y/Z plot就非常有用。

例如我想要查看我的舊版LoRA與新版LoRA在不同模型下,不同動作的樣子,我就會設定成:

  • X軸:Checkpoint name => 三個不同模型
  • Y軸:Prompt S/R => 五個不同動作
  • Z軸:Prompt S/R => 新的與舊的LoRA,權重都是0.3

下面就是我跑出來的成果:

X/Y/Z軸同時呈現

X/Y/Z軸同時呈現

預覽圖會有兩種版本,檔案較小的JPG檔,和非常巨大但無失真的PNG檔案。要做深度比較的時候,可以開啟PNG檔在大螢幕上仔細比較。

另外,LoRA自己也能跟自己不同權重做比較,讓你找出在不同模型下,哪個權重是甜蜜點:

以不同LoRA權重為Z軸做比較

以不同LoRA權重為Z軸做比較

順帶一提,我的舊版LoRA在權重0.8的時候就全部崩潰了,不管是哪個模型,出來的動作與背景都一樣。這表示舊版的LoRA品質不佳,而在我新訓練的LoRA上就不太會出現這種情形。這就可以讓我有足夠信心了解我的新版LoRA品質較穩定,可以順利取代舊版。

結語

以上就是我常用的X/Y/Z plot情境,希望可以節省大家手動輸入各種設定,無聊等待跑圖出結果,然後又改詞改設定再跑的時間。

祝大家AI算圖愉快!


進階技巧目錄:

留言
avatar-img
留言分享你的想法!
pang Wu-avatar-img
2023/04/27
看起來不錯用.謝謝教學!
子不語-avatar-img
發文者
2023/04/27
pang Wu 感謝稱讚!
子不語-avatar-img
發文者
2023/05/02
Stable Diffusion -- 訓練LoRA(四)提及了這篇文章,趕快過去看看吧!
子不語-avatar-img
發文者
2023/05/01
Stable Diffusion -- 訓練LoRA(三)提及了這篇文章,趕快過去看看吧!
avatar-img
子不語怪・力・亂・神
28.8K會員
430內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
2024/04/11
今天要聊聊一個我最近AI作圖時常用的手法,就是使用真實世界的照片拼接縫合進AI生產的圖片後,補完AI作圖常出現的缺陷(歪曲的武器、錯誤的肢體姿勢、手指錯誤)。 使用這個方法,可以讓AI更貼近我所需要的完成圖,且少了很多用繪圖軟體修修補補的時間。
Thumbnail
2024/04/11
今天要聊聊一個我最近AI作圖時常用的手法,就是使用真實世界的照片拼接縫合進AI生產的圖片後,補完AI作圖常出現的缺陷(歪曲的武器、錯誤的肢體姿勢、手指錯誤)。 使用這個方法,可以讓AI更貼近我所需要的完成圖,且少了很多用繪圖軟體修修補補的時間。
Thumbnail
2023/10/15
最近這幾天都在玩Stable Diffusion近期最火紅的外掛 -- AnimatedDiff。最近加上了prompt travel這個功能,加上新的v2模型讓整體畫面變得很穩定,所以一玩下去驚為天人,決定好好研究這個東西怎麼運作。
Thumbnail
2023/10/15
最近這幾天都在玩Stable Diffusion近期最火紅的外掛 -- AnimatedDiff。最近加上了prompt travel這個功能,加上新的v2模型讓整體畫面變得很穩定,所以一玩下去驚為天人,決定好好研究這個東西怎麼運作。
Thumbnail
2023/10/05
本篇要來解說一個最近新增的ControlNet前置處理器dw_openpose_full,如何使用它來快速修正爛掉的雙手手指。 這些方法的基礎都是使用實際的參考物,例如人偶網站的手,或者手指姿勢網站的手姿勢圖片來覆蓋掉原本的手,
Thumbnail
2023/10/05
本篇要來解說一個最近新增的ControlNet前置處理器dw_openpose_full,如何使用它來快速修正爛掉的雙手手指。 這些方法的基礎都是使用實際的參考物,例如人偶網站的手,或者手指姿勢網站的手姿勢圖片來覆蓋掉原本的手,
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
  在上篇我們介紹了 SageMaker 中 Pipeline 的使用方法,其中的 TuningStep 功能,能夠讓我們能夠指定一連串參數組合進行實驗比對,最終找出最適合的參數組合
Thumbnail
  在上篇我們介紹了 SageMaker 中 Pipeline 的使用方法,其中的 TuningStep 功能,能夠讓我們能夠指定一連串參數組合進行實驗比對,最終找出最適合的參數組合
Thumbnail
策略模式將多種演算法封裝於獨立的策略類別中,每個策略類別都實現了一個共同的介面。這種設計允許使用者在系統運行時動態選擇和切換演算法,以達成相同的目的。
Thumbnail
策略模式將多種演算法封裝於獨立的策略類別中,每個策略類別都實現了一個共同的介面。這種設計允許使用者在系統運行時動態選擇和切換演算法,以達成相同的目的。
Thumbnail
是否有時遇到一種情況,發現一種似乎有一定勝率的交易技術線型, 想回測時,若軟體沒有提供相關線型回測,就必須自己寫程式來呈現線型,進而回測 然而卻不知道如何用程式的方式將他呈現出來。 今天用XQ來做個簡單分享: 弄清楚運作模式 在懂得基本變數的情況下,最重要的是懂得程式是怎麼運作的, 無
Thumbnail
是否有時遇到一種情況,發現一種似乎有一定勝率的交易技術線型, 想回測時,若軟體沒有提供相關線型回測,就必須自己寫程式來呈現線型,進而回測 然而卻不知道如何用程式的方式將他呈現出來。 今天用XQ來做個簡單分享: 弄清楚運作模式 在懂得基本變數的情況下,最重要的是懂得程式是怎麼運作的, 無
Thumbnail
  編輯器是寫XQ最核心的位置,在開始學習時若能清楚知道這邊每個功能,相信往後寫程式時會順利許多,接來下我將解說XQ編輯器常見的使用與說明,希望新手朋友能好好了解。 Step1我們先找到XS編輯器的位置 Step2-瞭解XS編輯器各位置的功能是甚麼 上述的附圖與註解是幾個Xscipt編輯器比
Thumbnail
  編輯器是寫XQ最核心的位置,在開始學習時若能清楚知道這邊每個功能,相信往後寫程式時會順利許多,接來下我將解說XQ編輯器常見的使用與說明,希望新手朋友能好好了解。 Step1我們先找到XS編輯器的位置 Step2-瞭解XS編輯器各位置的功能是甚麼 上述的附圖與註解是幾個Xscipt編輯器比
Thumbnail
本文帶領大家學習如何調整 Stable Diffusion WebUI 上各種參數。我們以 txt2img 為例,帶大家認識基本設定、Sampling method 或 CFG scale 等各種參數調教,以及參數間彼此的影響,讓大家能夠初步上手,熟悉 AI 算圖!
Thumbnail
本文帶領大家學習如何調整 Stable Diffusion WebUI 上各種參數。我們以 txt2img 為例,帶大家認識基本設定、Sampling method 或 CFG scale 等各種參數調教,以及參數間彼此的影響,讓大家能夠初步上手,熟悉 AI 算圖!
Thumbnail
今天來聊一個我覺得是Script裡面最好用,最常用,但是有點複雜的進階功能,X/Y/Z plot。
Thumbnail
今天來聊一個我覺得是Script裡面最好用,最常用,但是有點複雜的進階功能,X/Y/Z plot。
Thumbnail
這節課主要介紹Midjourney 的命令列表(Command List),是用來操作機器人最主要的指令。
Thumbnail
這節課主要介紹Midjourney 的命令列表(Command List),是用來操作機器人最主要的指令。
Thumbnail
還記得之前介紹我的LINE Bot中第一個功能嗎?沒錯,就是部落格的選單,這選單看起來是不是比較華麗一點,但其實製作上相當簡單就可以完成,要如何製作就是我們今天要教的「客製化選單」
Thumbnail
還記得之前介紹我的LINE Bot中第一個功能嗎?沒錯,就是部落格的選單,這選單看起來是不是比較華麗一點,但其實製作上相當簡單就可以完成,要如何製作就是我們今天要教的「客製化選單」
Thumbnail
這次將會介紹「圖塊設置」的部分,關於素材規格的話請看這篇基礎入門篇 2 ( 1 ) -《圖片素材規格》。
Thumbnail
這次將會介紹「圖塊設置」的部分,關於素材規格的話請看這篇基礎入門篇 2 ( 1 ) -《圖片素材規格》。
Thumbnail
在前一篇介紹了「開關」與「變數」,那現在我們要來介紹如何在 RMMV 中讓人物開始有對話的劇情,這裡就要先介紹訊息。
Thumbnail
在前一篇介紹了「開關」與「變數」,那現在我們要來介紹如何在 RMMV 中讓人物開始有對話的劇情,這裡就要先介紹訊息。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News