方格精選

Stable Diffusion -- 訓練LoRA(一)

更新於 發佈於 閱讀時間約 7 分鐘


閒聊

就算有了LoRA,要跨到其他領域的模組,也要微調很久

就算有了LoRA,要跨到其他領域的模組,也要微調很久

剛剛在刷股癌的IG,看到一個很有趣的秘辛:

股癌的限時IG留言

股癌的限時IG留言

從我自己學了LoRA之後,在動漫模型裡練出了我要的角色圖樣之後,再餵進colab訓練出LoRA,然後把LoRA用在真人向模型,結果就能弄出各種逆天實景:

在冰川遺跡上外拍

在冰川遺跡上外拍

所以,Stable Diffusion上面除了學好提示詞算是基本技巧,接下來的LoRA,ControlNet3D OpenPose Editor等都是讓你的出圖時間更快的進階技巧。確實可以大幅縮短創作時間。

閒話時間結束了,開始正文吧。

準備

LoRA可以在很多地方下載不同的角色、物品、風格,例如Civita.com,huggingface.co。但是如果你想要訓練自己的LoRA,像我一樣,那你需要準備好訓練的素材圖,才能順利烘焙LoRA。

  • 數量:依照經驗,7張到100張都可以,但是張數過少,同一張訓練的次數會非常多,訓練出來的LoRA在高權重的時候會讓算出來的圖嚴重變形(尤其是背景部分)。所以最好是20張上下。當然你可以用鏡像出圖的方法讓訓練圖數量加倍,但這樣還是沒辦法避免高權重下整體變形的問題。
  • 品質:如果是訓練人物或物品的LoRA,最好不要有太多同一個角度,同一個表情的圖片,尤其在張數少的情況下,訓練出來的LoRA會有人物表情僵直的問題。人物的臉通常是LoRA的重點,最好能有面孔多角度,不同光影,不同表情,不同服裝配件,讓模型能夠涵蓋夠多的情況。切記不要加入模糊失焦、被擋住部份臉部的圖片,除非你準備的張數夠多。
  • 尺寸:以Stable Diffusion 1.X為基準訓練的圖片要求至少要是512x512像素的正方形圖片,而Stable Diffusion 2.X的話圖片至少要768x768像素。

裁切

當我們準備好圖片之後,就要開始裁切,如果沒有洩密疑慮的話,什麼美術工具都不會的美術小白可以使用BIRME這個網站,把過大的尺寸裁切成512x512的訓練素材圖:

使用BIRME裁切訓練素材

使用BIRME裁切訓練素材

預處理

接下來是最重要的一步,LoRA的品質除了跟訓練圖本身的品質,以及訓練的設定有關之外,另一個重點是訓練圖的提示詞文本。

有關如何在Automatic1111上幫訓練圖提煉提示詞文本,在AI繪圖-用Lora打造你的夢幻模特兒吧!三集之二:訓練Lora模型圖片預處理小節就有詳盡的步驟,請自行觀看。

這裡要提的是不同處:

在Use BLIP for caption與Use deepbooru for caption這兩個選項,我都用BLIP來提煉提示詞,因為deepbooru給的提示詞實在太多了,很多其實是瞎猜,如果你的訓練圖超過30張,光是刪掉不對的提示詞就夠累了。

第二點,你必須打開每個提示詞文本檔案,一個一個修正提示詞,否則你怎麼訓練都不會練出有用的LoRA。

以我想要訓練的角色為例:

  • 名字(提示詞):Vallaria。
  • 外表特徵:銀白色頭髮,白皮膚,深藍色眼眸,黑眉毛,有雀斑。

名字最好是夠獨特的,如果太菜市場的名字,會跟模組裡面的同名物體衝突,如果真的不想取其他名字,試試看後面加數字,例如Jack999,避免衝突。

(順帶一提,SD裡面真的有一個叫Jack的提示詞,會算出成年男性,雖然每次叫出來的Jack都長得不一樣😄)

當你打開提示詞文件時,可能會看到像這樣的敘述:

a woman with white hair and blue eyes and black robe and a flower on the shoulder of the robe at a snowy street.
  1. 此時,要將對象提示詞a woman換成你要的角色名,在這個例子要換成Vallaria。
  2. 接著,把關於髮色white hair與眼眸顏色blue eyes等我們定義好的外表特徵也刪掉。
  3. 接著,觀察原本的圖片,把不是你想要但是顯示在圖片上的提示詞寫進去,例如頭上有戴帽的話就要加hat,背景的光線佈局與季節是秋光autumn lights,她手上有一根燭台之類的,與角色特徵無關,但是預處理程式沒抓出來的事情。

更改過的提示詞會變成這樣:

Vallaria with black robe and a hat on her head and a flower on the shoulder of the robe at a snowy street, autumn lights, candle stick on her hand

你大概會覺得這句子文法不通。沒關係,電腦在訓練時會將整個提示詞文本用自己的方法拆成一堆單詞,電腦是不太在乎文法的。

至於為什麼要刪掉特徵,加上沒提到的事情,是因為這就是訓練的目的。

AI學習算圖,就是建立在圖形與提示詞的關聯上,所以當電腦發現這是一個藍眼睛白皮膚白頭髮的女性,但是卻在提示詞文本上找不到眼睛顏色、頭髮顏色、皮膚顏色的提示詞,卻反而每張圖都有一個叫Vallaria的提示詞時,他就會學到Vallaria等於藍眼睛白髮的白人女性,以及諸如臉型,五官比例等等特徵。

相反地,你不要AI建立關聯的特質,就必須要盡量標示出來,例如我的訓練圖八成以上Vallaria都有戴上帽子或公主冠等頭飾,就必須要在每個出現的圖片上都標示在提示詞文本上,否則AI會認為頭上有頭飾是這個角色的外表特徵,訓練出來的LoRA會變成Vallaria出現時,頭上必戴公主冠的問題。

準備訓練

將訓練圖與文本都準備好之後,請上Google Drive確認自己有足夠多的空間(大約1到2GB),沒有Google帳號的請申請,我們將在下一篇開始訓練LoRA,而且這個方式不需要本機安裝任何東西,也不需要任何怪獸顯卡,人人都能用!

接下來,就是正式訓練:

Stable Diffusion -- 訓練LoRA(二)

參照

AI繪圖-用Lora打造你的夢幻模特兒吧!三集之二:訓練Lora模型


LoRA目錄:


留言
avatar-img
留言分享你的想法!
國強張-avatar-img
2024/01/13
我正再學習畫漫畫跟動漫感謝妳
子不語-avatar-img
發文者
2023/05/24
Stable Diffusion -- 訓練LoRA(五)提及了這篇文章,趕快過去看看吧!
子不語-avatar-img
發文者
2023/05/01
Stable Diffusion -- 訓練LoRA(三)提及了這篇文章,趕快過去看看吧!
Wing Chung Mo-avatar-img
2023/04/27
想請教一下風格類的LORA是如何制作?有什麼重點?例如菲林相效果,如何選取訓練素材和標示提示詞?另外例如皮膚紋理細節,又該如何制作呢?
子不語-avatar-img
發文者
2023/04/27
Wing Chung Mo 這裡有個超猛的風格LoRA的訓練影片,長一個小時,還沒時間看,但是應該是你要的: https://www.youtube.com/watch?v=7m522D01mh0
子不語-avatar-img
發文者
2023/04/25
AI算圖,Stable Diffusion的頭一個月提及了這篇文章,趕快過去看看吧!
avatar-img
子不語怪・力・亂・神
29.5K會員
431內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
2023/06/26
這篇討論的是LoRA訓練裡面,可能是最重要的一步,就是選圖的標準,以及提示詞的選取策略。 最近在詳細研究到底要如何練出優質穩定的LoRA,參考了幾個Youtuber,以及Reddit上的影片跟文字分享,把一些訣竅整理條列在下面。
Thumbnail
2023/06/26
這篇討論的是LoRA訓練裡面,可能是最重要的一步,就是選圖的標準,以及提示詞的選取策略。 最近在詳細研究到底要如何練出優質穩定的LoRA,參考了幾個Youtuber,以及Reddit上的影片跟文字分享,把一些訣竅整理條列在下面。
Thumbnail
2023/05/24
這篇要來討論,我們是否能靠著一張圖,就能鍛鍊出LoRA。
Thumbnail
2023/05/24
這篇要來討論,我們是否能靠著一張圖,就能鍛鍊出LoRA。
Thumbnail
2023/05/02
接續上一篇,我們開始用準備好的訓練素材圖跟規範圖來烘焙我們的高品質LoRA。
Thumbnail
2023/05/02
接續上一篇,我們開始用準備好的訓練素材圖跟規範圖來烘焙我們的高品質LoRA。
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
這篇文章要討論一種跟 Stable Diffusion進階 -- 漸進式光影 類似,但是用了多重人物LoRA的時候,同時又要求穩定性的調整光影手法。
Thumbnail
這篇文章要討論一種跟 Stable Diffusion進階 -- 漸進式光影 類似,但是用了多重人物LoRA的時候,同時又要求穩定性的調整光影手法。
Thumbnail
本篇文章要討論一個在出擬真或真人類型的圖片時,常常遇到的問題,就是光源太亮。 在許多熱門模型上,由於使用太多大白天模特兒的圖片,或者攝影棚高光圖片來訓練,所以在弄出人物時,儘管場所設定在夜間,也會出現不自然的超高光,或者整個照片的光源陰影不遵照提示詞來佈局的問題。
Thumbnail
本篇文章要討論一個在出擬真或真人類型的圖片時,常常遇到的問題,就是光源太亮。 在許多熱門模型上,由於使用太多大白天模特兒的圖片,或者攝影棚高光圖片來訓練,所以在弄出人物時,儘管場所設定在夜間,也會出現不自然的超高光,或者整個照片的光源陰影不遵照提示詞來佈局的問題。
Thumbnail
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
Thumbnail
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
Thumbnail
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
Thumbnail
當我們算圖時,有一種特殊情況是,我們對於整張圖的結果都很滿意,但是想要調整人物的表情。我們可以這樣做......
Thumbnail
簡單訣竅,如何把模組與LoRA預覽圖放進Automatic1111顯示。
Thumbnail
簡單訣竅,如何把模組與LoRA預覽圖放進Automatic1111顯示。
Thumbnail
前言 今天來分享如何把一張彩色圖片轉換成一張漫畫風格的黑白線稿的方法。 例如我想把一張水彩稿,或者一張照片轉換成黑白漫畫稿,不只是簡單地把一張圖換成灰階,而是連線條與陰影都要是漫畫風格。
Thumbnail
前言 今天來分享如何把一張彩色圖片轉換成一張漫畫風格的黑白線稿的方法。 例如我想把一張水彩稿,或者一張照片轉換成黑白漫畫稿,不只是簡單地把一張圖換成灰階,而是連線條與陰影都要是漫畫風格。
Thumbnail
今天要來講的,是如何使用Stable Diffusion來製作角色設定圖。 經過了好幾次的嘗試之後,我找出了一個最穩定出圖,且步驟最少的方法。
Thumbnail
今天要來講的,是如何使用Stable Diffusion來製作角色設定圖。 經過了好幾次的嘗試之後,我找出了一個最穩定出圖,且步驟最少的方法。
Thumbnail
本文教導你如何準備LoRA訓練的素材與選擇合適的提示詞。
Thumbnail
本文教導你如何準備LoRA訓練的素材與選擇合適的提示詞。
Thumbnail
今天來説説常用的兩個提示詞訣竅: 如何使用Automatic1111抓出提示詞 如何把圖片的提示詞匯入img2img
Thumbnail
今天來説説常用的兩個提示詞訣竅: 如何使用Automatic1111抓出提示詞 如何把圖片的提示詞匯入img2img
Thumbnail
這邊繼續上一集的內容,進入這一章節時,你應該是已經安裝好stable diffusion webui跟Kohya's GUI了。 這一章就真的要開始準備訓練Lora模型了,步驟有點雜,我拆成四個小步驟來看,這一章節也是最重要的,以後忘了步驟時,也只要回頭來看這一篇就行了。
Thumbnail
這邊繼續上一集的內容,進入這一章節時,你應該是已經安裝好stable diffusion webui跟Kohya's GUI了。 這一章就真的要開始準備訓練Lora模型了,步驟有點雜,我拆成四個小步驟來看,這一章節也是最重要的,以後忘了步驟時,也只要回頭來看這一篇就行了。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News