以下假設你原本就有一套stable-diffusion-webui AUTOMATIC1111了,更新方式很簡單:
直接在指令視窗中切換到AUTOMATIC1111的安裝資料夾,並輸入指令git pull即可自動完成更新。
但網路上也是有更新失敗的案例,所以建議備份。(我是懶人我直接更新了。)
更新後的第一次啟動需要再等候一些時間,因為它會再自動安裝一些新元件。
詳細的更新項目可以在此參考官網訊息
以下只列出我個人覺得感受明顯的實用更新項目,我認為這些項目是一般繪圖操作就會直接用到,算是對一般大眾來說都重要的更新內容。
以往若要開啟Lora或是embeddings等項目都要先按一個小紅點才會跳出選單:
而在新版本中,這些內層選單直接常駐在主介面中了,增加了操作的方便性:
總共增加以下項目:
Restart, DPM++ 2M SDE Exponential, DPM++ 2M SDE Heun, DPM++ 2M SDE Heun Karras, DPM++ 2M SDE Heun Exponential, DPM++ 3M SDE, DPM++ 3M SDE Karras, DPM++ 3M SDE Exponential
這功能主要是對應近期的大模型SDXL及其衍生模型。
在上一篇文章中,可知SDXL的運作其實是繪圖+精鍊兩個模型一組的,在舊版本中,我們要先運行一次SDXL完成繪圖,接著再將此圖片傳入img2img進行二次精鍊(refiner),這整個過程都是手動的。
(詳情可參閱:AI繪圖-教學:如何在stable diffusion webui上使用最新的SDXL? )
而在新版中已經把refiner融入一般操作流程了,在下層UI中可以直接從選單中選擇refiner模型。
以下圖為例代表主模型選擇了SDXL_Base,而refiner則選擇了與其配套的SDXL_refiner。Switch at代表當繪圖進度到多少百分比的時候就改由refiner接手,如果調到0.6代表當繪圖進度達60%時就改由refiner接手進行精鍊,頗有雙模型合作繪圖的那種意味。
以下是一個以SDXL模型繪圖其精鍊前後的例子:
有趣的是,這個功能並非是SDXL專屬的,一般繪圖模型也可以玩玩,可以試試這種雙模型繪圖的樂趣。以下舉一個風格較強烈的例子,先用Anything V4.5這種純動漫風的模型當做基底,再與majicmixRealistic這種完全寫實的模型當做refiner看看會有什麼效果:
由以上案例可以看出精鍊後在原本的二次元圖片中加入了明顯的寫實風格。
舊版的操作介面幾乎是固定不可變的,而在新版中多了自定義項目,可以自由操控UI中的項目。
具體方式是先在Settings頁面中點選User Interface。
再往下滑動會看到兩個子選項Options in main UI - txt2img以及Options in main UI - img2img,這兩個選項分別代表要在文生圖或是圖生圖介面中加入哪些自定義項目(有下拉選單可以選擇)。
以下圖為例代表我在文生圖介面中加入了jpeg_quality這個項目,確認好設定後點擊頁首的Apply Settings與Reload UI即可生效。
接著回到文生圖介面即可看到頁面中多了一個控制jpeg品質的設定項:
在各個大小模型選單中,增加了補充訊息的定義功能:
以下是繪圖模型(Checkpoints)的定義頁面示例:
除了可以寫入該模型的文字說明,註解,還可以設定此模型的預設VAE還有預覽圖,算是增加一點操作上的便利和美觀。
不同類型的項目可定義的內容都不同,此處就不展開說明。
這個項目眼睛無法直接看到,但你一定"感覺"的到。
由於我平常沒有在紀錄秒數,故僅以我最常使用且較有印象的繪圖方式做為比較案例。
在舊版本中,我使用一般模型並套用一個Lora繪製800*1000的圖片,單圖大約在8秒至十幾秒之間,但在更新版本後,單圖的繪製耗時加速至5秒上下,這個差距雖然只有幾秒,但感受還是明顯的。也許在一些繪圖本來就偏慢的中低階顯卡上帶來的效益會更明顯。
在上一篇介紹SDXL的文章中,我有提到SDXL會佔用較多的VRAM,使我不得不使用額外的啟動參數--medvram才能夠順利執行SDXL:
然而這個參數是強迫軟體使用較少的VRAM來運作,多少會影響效能,然而我在一般繪圖其實是不需要使用這個參數的,卻單單為了SDXL不得不做此妥協。
但在新版中也有解法了,新版新增一個啟動參數--medvram-sdxl,這可以使--medvram單獨作用在SDXL模型中,而不影響其餘操作,算是解除了我的一大痛點。
以往在多個繪圖模型之間切換時,每次切換都要重新載入讀取,而在新版中它可以一次緩存多個模型,當你在多個模型之間切換時,可以減少切換讀取的時間。
具體的緩存數量可以由Settings設定項中的Maximum number of checkpoints loaded at the same time來做選擇,實際上限應該是與硬體有關。
最近比較少寫AI繪圖的文章了,原因是我實在感覺不出近期的AI繪圖有何重要大事,目前AI繪圖算是進入一個穩定的成熟期了,主要功能已經發展的很方便很實用,暫時玩不出新花樣了,而週邊項目的更新與異動大多只是錦上添花罷了。
例如最近很多網路影片喜歡展示的圖片轉動畫,我覺得還很不實用就不太想介紹,圖片轉影片或是文字轉影片所生出來的影片都很短,內容也不穩定,也無法真正的自定義動畫內容,目前這方面的應用還是實驗性的,偏趣味性的。
當然AI繪圖還不完美,還有很大的進步空間,例如那個永遠畫不好的手,以及每次都像是在抽卡的隨機性,叫各位說出心中對AI繪圖的抱怨肯定還是能說出一大堆,所以我們還能期待AI繪圖下一次的爆點。