2023-06-14|閱讀時間 ‧ 約 6 分鐘

Stable Diffusion基礎 -- 外掛(Extensions)

前言

本篇要來解說Automatic1111這個軟體很重要的一部分,就是外掛(Extension)管理。
外掛是Automatic1111之所以超越玩具與學術研究工具,成為有生產力的軟體的關鍵,開放社群為了Automatic1111製作了許多威力強大的外掛,讓它不僅能生產美圖,也能生產有客戶委託的商業用圖片,甚至是製作AI生成影片。許多功能都是從Extensions這個頁籤下管理。

瀏覽已裝外掛

當我們切換到Extension頁籤,第一個子頁籤是已安裝(Installed)外掛,這頁展示了所有我們安裝的外掛,它的來源路徑,它的版本與更新時間,還有更新裝態。我們可以按下Check for updates來自動檢查並更新外掛,還有Apply and restart UI按鈕來重啟Automatic1111讓外掛的安裝與更新生效。
已安裝外掛
已安裝外掛
如果我們按下URL欄位裡面的連結,就能到外掛的主要頁面,在那些主要頁面上通常都會有豐富的說明文件來解釋如何使用這些外掛,尤其是許多大型的知名外掛,都會有詳盡的解說文件,以及報錯區和討論區讓我們知道個別外掛的最新資訊。

安裝外掛

第二與第三個頁籤(Available,Install from URL)是安裝外掛的頁籤。
在Available頁面下,Automatic1111維護了一個特別的頁面,容納了所有經過測試與整合的外掛,可以視為Automatic1111推薦的外掛列表,當我們按下Load from按鈕之後,就會自動讀取該列表,然後列出詳細資料。我們在想安裝的外掛的最後一欄的Install按鈕按一下,就能快速安裝此外掛。
安裝官方驗證外掛
但如果該外掛太新,或者想安裝的是外掛的某些變形版本,就必須用Install from URL來安裝。基本上填寫該外掛的Git路徑,分枝(Branch)名,本地目錄名,按下Install就能安裝。
通常這種方法安裝的外掛要不就是太新,官方還來不及收錄,要不就是太舊,原作者不維護了,所以安裝其他維護者製作的版本,或者不想讓官方收錄的特製外掛,或者根本就是自製的外掛。
安裝其他來源的外掛

更新外掛

外掛的更新很簡單,就是在Installed頁籤下按下Check for updates,所有已安裝外掛就會更新到最新版。通常只要再按下Apply and restart UI就能讓更新檔生效。但是有些大型外掛因為還會額外更新底層的python函式庫,因此比較保險的做法是直接關閉Automatic1111然後重新開啟,這樣最能保證所有功能都生效,不會出現奇怪的錯誤。

移除外掛

目前Automatic1111沒有正規的移除方法,頂多就是在Installed頁籤下取消打勾將此外掛暫時暫停。如果想要完全移除外掛的話,就要到Automatic1111的安裝目錄下,找到/extensions/這個目錄,再找到這個外掛的資料夾後把它扔進垃圾桶。最後重開Automatic1111,它才會從系統中消失。

推薦外掛

下列是一些我目前在使用的外掛裡面,覺得有實用價值的:
sd-webui-controlnet必裝外掛。鼎鼎大名的ControlNet。除了安裝這個外掛之外,還必須下載許多它使用的特殊模型才能正常使用。基本上沒有裝這個外掛,Automatic1111就只是個玩具以及科學研究用軟體。裝上這個外掛,它就成了有商業生產力的強力工具。
Image browser必裝外掛。能讓使用者瀏覽生產出來的圖片,並且快速管理與評分圖片,如果Automatic1111是開啟聆聽模式或者分享模式,這個外掛可以讓使用者跨網路存取所有圖片,非常有用。
3D Openpose Editor:與ControlNet的Openpose非常相關的外掛,可以讓使用者快速建構Openpose的骨架。不過也可以使用PoseMy.Art等網站或App來生產Openpose圖片。
stable-diffusion-webui-rembg:使用AI智慧移除背景演算法替使用者移除圖片背景的外掛。由Automatic1111官方開發的外掛。在很多情況下有許多替代用法,所以算是一個方便但不必要的外掛。
TiledDiffusion with Tiled VAE:如果需要處理多人圖片,或者結構複雜的圖片,這幾乎是必裝外掛,它提供兩個主要功能:
Tiled Diffusion:它可以指定不同分區使用不同提示詞,讓一張圖的不同部分產生不同的圖片。
Tiled VAE:這功能開啟之後,能夠對Tiled Diffusion的圖片輸出進行分塊處理,所以能得到更精細繁複的圖片,而且能用比較少的記憶體輸出圖片。
Latent Couple 加上 Composable LoRA: 如果需要處理多人圖片,幾乎是必裝外掛。這兩個外掛功能是:
Latent Couple:提供分區指定不同的提示詞,讓一張圖產生不同的部分。
Composable LoRA:能讓不同部分的子提示詞套用不同的LoRA,這樣才能避免複數LoRA混合在一起的問題。在圖片上有多數人物且每個人物需要套用特定LoRA時特別重要。
本外掛與Tiled Diffusion的不同點在於,Latent Couple是作用在同一個Latent Space上,所以圖內的人物可以有互動,而Tiled Diffusion是作用於數個Latent Space之後再合併起來,前景物件只能與背景物件互動,兩個前景物件是無法互動的。(例如兩個角色互視或者手牽手)
Dynamic Prompts:非常強大的外掛,可以隨機產生特定範圍的提示詞,以及支援許多新的語法,讓提示詞的變動能力大增。
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.