Stable Diffusion進階 -- X/Y/Z plot

更新於 2023/05/18發佈於 2023/04/26閱讀時間約 7 分鐘

今天來聊一個我覺得是Script（腳本區）裡面最好用，也是最常用，但是有點複雜的進階功能，X/Y/Z plot。

前言

很多時候，我們有許多重複跑圖，但是一次只改一點點的需求，例如你算到了一個你很喜歡的角色形象，想要使用一樣的提示詞，但是一次改一點東西，例如改變髮色比例，更改服裝，更改一些動作，然後製造大量的圖用做訓練LoRA的範例圖。或者單純是想跑出一個你更喜歡的變體。

或者，你剛訓練完一個新版的LoRA，想要比較新舊版之間的差別，例如權重高低時影響畫面的程度，CFG Scale不一樣會造成什麼改變，改變提示詞會不會被新版LoRA覆蓋掉。

在什麼都不知道的情況下，我們只能一張一張生產，等上一張算好之後再手動更改提示詞，然後繼續跑下一張。這種作法不只無聊，也很容易出錯，如果要測量的選項太多還會累死人，消耗時間與熱情。所以Automatic1111非常貼心地幫我們準備了一個功能，讓我們可以一次跑出大量有細小差別的圖，那就是X/Y/Z plot。

用法

X/Y/Z plot是什麼意思？它的XYZ指的是，我們可以最多設定三種方向的變數讓我們跑圖，例如X方向上選擇提示詞，Y方向上選擇Sampling Steps，Z方向上選擇模型，這樣就能測試在不同模型上，不同Sampling Steps對上不同提示詞所造成的影響。

舉一個例子，當我算出了一個猛男戰士之後，想要快速嘗試不同動作加上不同衣著上的表現，我們就可以選擇X方向上是一組動作提示詞，Y方向上是一組衣著的提示詞。

當我們在Script選單選擇X/Y/Z plot之後，會出現這樣的選單：

打開X type，裡面有一堆選項，裡面比較常用到的是：

Nothing：什麼都不做
Steps：訓練步數
CFG Scale：CFG程度
Prompt S/R：提示詞搜尋並取代
Sampler：採樣器
Checkpoint name：模型
Styles：你儲存的提示詞

這裡面Prompt S/R是最常用，但也是最難理解的選項，它的用法就是用逗號隔開一組提示詞，而第一個提示詞必須符合一個你的正面或負面提示詞，只要它能找到，就會在之後的圖取代這個提示詞。

例如我的正面提示詞中有(resting)這個提示詞，我就能用這樣的Prompt S/R來取代它：

(resting), (sitting), (standing), (fighting), (angry), (riding horse)

於是Automatic1111就能先跑出該角色休息的圖，然後下一張換成坐下的圖，以此類推。

而且X/Y/Z plot並不限制你只能用一次Prompt S/R，所以理論上XYZ三個軸都能用不同的詞來探索。以我的例子，我的X/Y/Z plot會像是這樣：

而我為了讓每次跑的時候出現的圖盡量產生差異，我會勾選Keep-1 for seeds，讓每張圖都使用亂數種子算圖。

當你按下Generate鈕之後，就可以去睡個午覺了，通常一次都可以跑個十幾二十張。等到你回來，Automatic1111會給你一個拼接的預覽圖：

在這圖上，從左到右是X軸，從上到下是Y軸。而這些算出來的圖，則是會放在一般圖生圖的目錄內。

LoRA比較

我個人在用X/Y/Z plot時，最常用的情況是在訓練LoRA時。當我們用了不同的素材，不同的參數或不同的程式版本烘焙LoRA的時候，比較新舊版本的優劣，尤其是LoRA在不同模型時能否正確產生我們要的角色，又不會強烈改動模型風格，就是決定人物型LoRA品質的指標，這時候X/Y/Z plot就非常有用。

例如我想要查看我的舊版LoRA與新版LoRA在不同模型下，不同動作的樣子，我就會設定成：

X軸：Checkpoint name => 三個不同模型
Y軸：Prompt S/R => 五個不同動作
Z軸：Prompt S/R => 新的與舊的LoRA，權重都是0.3

下面就是我跑出來的成果：

預覽圖會有兩種版本，檔案較小的JPG檔，和非常巨大但無失真的PNG檔案。要做深度比較的時候，可以開啟PNG檔在大螢幕上仔細比較。

另外，LoRA自己也能跟自己不同權重做比較，讓你找出在不同模型下，哪個權重是甜蜜點：

順帶一提，我的舊版LoRA在權重0.8的時候就全部崩潰了，不管是哪個模型，出來的動作與背景都一樣。這表示舊版的LoRA品質不佳，而在我新訓練的LoRA上就不太會出現這種情形。這就可以讓我有足夠信心了解我的新版LoRA品質較穩定，可以順利取代舊版。

結語

以上就是我常用的X/Y/Z plot情境，希望可以節省大家手動輸入各種設定，無聊等待跑圖出結果，然後又改詞改設定再跑的時間。

祝大家AI算圖愉快！

進階技巧目錄：

留言

留言分享你的想法！

pang Wu

2023/04/27

看起來不錯用.謝謝教學！

子不語

發文者

2023/04/27

pang Wu 感謝稱讚！

子不語

發文者

2023/05/02

在Stable Diffusion -- 訓練LoRA（四）提及了這篇文章，趕快過去看看吧！

子不語

發文者

2023/05/01

在Stable Diffusion -- 訓練LoRA（三）提及了這篇文章，趕快過去看看吧！

子不語怪・力・亂・神

29.7K會員

432內容數

寫奇幻小說，畫圖，心得，各式各樣作品的故鄉。

子不語怪・力・亂・神的其他內容

2024/04/11

照片縫合AI圖

今天要聊聊一個我最近AI作圖時常用的手法，就是使用真實世界的照片拼接縫合進AI生產的圖片後，補完AI作圖常出現的缺陷（歪曲的武器、錯誤的肢體姿勢、手指錯誤）。使用這個方法，可以讓AI更貼近我所需要的完成圖，且少了很多用繪圖軟體修修補補的時間。

2024/04/11

照片縫合AI圖

2023/10/15

AnimateDiff簡易動畫製作

最近這幾天都在玩Stable Diffusion近期最火紅的外掛 -- AnimatedDiff。最近加上了prompt travel這個功能，加上新的v2模型讓整體畫面變得很穩定，所以一玩下去驚為天人，決定好好研究這個東西怎麼運作。

2023/10/15

AnimateDiff簡易動畫製作

2023/10/05

Stable Diffusion進階 -- OpenPose手部修復

本篇要來解說一個最近新增的ControlNet前置處理器dw_openpose_full，如何使用它來快速修正爛掉的雙手手指。這些方法的基礎都是使用實際的參考物，例如人偶網站的手，或者手指姿勢網站的手姿勢圖片來覆蓋掉原本的手，

2023/10/05

Stable Diffusion進階 -- OpenPose手部修復

看更多

你可能也想看

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

全球科技產業的焦點，AKA 全村的希望 NVIDIA，於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1，實際日曆期間為今年二到四月)，交出了打敗了市場預期的成績單。然而，在銷售持續高速成長的同時，川普政府加大對於中國的晶片管制......

#NVDA#NVIDIA#輝達

2025/06/18

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

#NVDA#NVIDIA#輝達

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

重點摘要： 6 月繼續維持基準利率不變，強調維持高利率主因為關稅點陣圖表現略為鷹派，收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變，強調需要維持高利率是因為關稅：聯準會 (Fed) 召開 6 月利率會議

#Fed#聯準會#美股

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

#Fed#聯準會#美股

2025/06/18

貓貓學習筆記

SageMaker-使用TuningStep找尋最好的超參組合

　　在上篇我們介紹了 SageMaker 中 Pipeline 的使用方法，其中的 TuningStep 功能，能夠讓我們能夠指定一連串參數組合進行實驗比對，最終找出最適合的參數組合

#AI#AWS#SageMaker

2024/05/20

貓貓學習筆記

SageMaker-使用TuningStep找尋最好的超參組合

#AI#AWS#SageMaker

2024/05/20

再寫5分鐘

軟體設計模式 | 策略模式

策略模式將多種演算法封裝於獨立的策略類別中，每個策略類別都實現了一個共同的介面。這種設計允許使用者在系統運行時動態選擇和切換演算法，以達成相同的目的。

2024/04/24

2024/04/24

從零到有，將腦中策略落實到程式(1)-資料讀取

是否有時遇到一種情況，發現一種似乎有一定勝率的交易技術線型，想回測時，若軟體沒有提供相關線型回測，就必須自己寫程式來呈現線型，進而回測然而卻不知道如何用程式的方式將他呈現出來。今天用XQ來做個簡單分享：弄清楚運作模式在懂得基本變數的情況下，最重要的是懂得程式是怎麼運作的，無

#資料#讀取#XQ

2023/12/05

richard交易點點滴滴

從零到有，將腦中策略落實到程式(1)-資料讀取

#資料#讀取#XQ

2023/12/05

阿尼的沙龍

Xscript頁面導覽

　　編輯器是寫XQ最核心的位置，在開始學習時若能清楚知道這邊每個功能，相信往後寫程式時會順利許多，接來下我將解說XQ編輯器常見的使用與說明，希望新手朋友能好好了解。 Step1我們先找到XS編輯器的位置 Step2-瞭解XS編輯器各位置的功能是甚麼上述的附圖與註解是幾個Xscipt編輯器比

2023/08/14

2023/08/14

最詳細的 Stable diffusion WebUI 操作教學 – txt2img

本文帶領大家學習如何調整 Stable Diffusion WebUI 上各種參數。我們以 txt2img 為例，帶大家認識基本設定、Sampling method 或 CFG scale 等各種參數調教，以及參數間彼此的影響，讓大家能夠初步上手，熟悉 AI 算圖！

#StableDiffusion#txt2img#AI繪圖

2023/06/07

KodingWork的沙龍

最詳細的 Stable diffusion WebUI 操作教學 – txt2img

#StableDiffusion#txt2img#AI繪圖

2023/06/07

子不語怪・力・亂・神

Stable Diffusion進階 -- X/Y/Z plot

今天來聊一個我覺得是Script裡面最好用，最常用，但是有點複雜的進階功能，X/Y/Z plot。

#StableDiffusion#AI#AI繪圖

2023/04/26

子不語怪・力・亂・神

Stable Diffusion進階 -- X/Y/Z plot

今天來聊一個我覺得是Script裡面最好用，最常用，但是有點複雜的進階功能，X/Y/Z plot。

#StableDiffusion#AI#AI繪圖

2023/04/26

📊科技新知專欄討論區

Midjourney技巧教學-第四課：命令列表

這節課主要介紹Midjourney 的命令列表(Command List)，是用來操作機器人最主要的指令。

#Midjourney#AI繪圖#教學

2023/04/18

📊科技新知專欄討論區

Midjourney技巧教學-第四課：命令列表

這節課主要介紹Midjourney 的命令列表(Command List)，是用來操作機器人最主要的指令。

#Midjourney#AI繪圖#教學

2023/04/18

陳式語言の投資之道

Python+LINE Bot 輕鬆打造股市機器人(八) : LINE Bot基本功能- 客製化選單

還記得之前介紹我的LINE Bot中第一個功能嗎?沒錯，就是部落格的選單，這選單看起來是不是比較華麗一點，但其實製作上相當簡單就可以完成，要如何製作就是我們今天要教的「客製化選單」

#python#LINEBot#GitHub

2022/03/26

陳式語言の投資之道

Python+LINE Bot 輕鬆打造股市機器人(八) : LINE Bot基本功能- 客製化選單

#python#LINEBot#GitHub

2022/03/26

ReIris

資料設定篇 ( 10 )－《圖塊設置》

這次將會介紹「圖塊設置」的部分，關於素材規格的話請看這篇基礎入門篇 2 ( 1 ) －《圖片素材規格》。

#RMMV#RPGMakerMV#RPG製作大師

2019/12/05

ReIris

資料設定篇 ( 10 )－《圖塊設置》

這次將會介紹「圖塊設置」的部分，關於素材規格的話請看這篇基礎入門篇 2 ( 1 ) －《圖片素材規格》。

#RMMV#RPGMakerMV#RPG製作大師

2019/12/05

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News