增加訓練LoRA、LoCon模型的精準度 - Stable Diffusion

黑米BR

發佈於AI紀行

2023/04/10 更新2023/04/10 發佈閱讀 6 分鐘

本教學使用Automatic 1111介面

　　AI繪圖風行至今，網上已有不少中文教學，包括教導如何訓練LoRA、LoCon等模型的文章，而訓練上述模型時，通常會經過一道「Preprocess Images」工序，中文稱為「圖片預處理」。

　　預處理很常勾選「Use deepbooru for caption」（上圖紅框），並在預處理完成後生成配對每張圖片的.txt文字檔案－－大多數的教學文在這道步驟後就直接開始訓練。

　　這樣其實很可惜，因為只要再多花點工夫，就可以顯著提升訓練成果的「準確度」，且只需要中等程度的英文能力和基本的關鍵字蒐圖技巧。

deepbooru - Danbooru

　　在勾選「Use deepbooru for caption」時，有沒有想過什麼是「deepbooru」？其實這和Stable Diffusion訓練來源的圖片有很大的關係，也就是下列網站：

https://danbooru.donmai.us/
＊未成年者請勿點入＊未成年者請勿點入＊未成年者請勿點入

　　而進行圖片預處理後，有沒有想過為什麼會生成.txt文字檔案？

　　其實只要打開生成的.txt，就會發現是和+Prompts類似的內容。換言之，預處理就是AI以圖片反推關鍵字的工序，而deepbooru的反推結果會套用Danbooru的關鍵字格式。

　　以下是兩張範例：

　　注意到了嗎？AI預處理產生的關鍵字「不太理想」。舉例而言，範例1的.txt沒有「狐狸」和背景的「薰衣草」，而且紅框圈起的「purple_sky」（紫色天空）根本不存在。

　　範例2的.txt問題就更多了，例如雙胞胎的眼睛和頭髮的顏色各只提供一種、完全沒提到衣服的顏色，以及最糟糕的「own_hands_together」（自己握自己的手）！

　　試想一下，如果就這樣直接交給AI訓練LoRA、LoCon模型，AI當然會產生「困惑」、進而算出「無厘頭」的結果－－不是因為AI笨，而是AI很忠實地遵照了荒謬的關鍵字！

參考Danbooru，修正文字檔的內容

　　這時就輪到https://danbooru.donmai.us/(*未成年者請勿點入)登場並充分運用英文知識的時候了。既然「deepbooru」生成了Danbooru格式的關鍵字，若要修正其內容，理所當然最好的方式就是去Danbooru尋找正確的關鍵字。

　　以範例1而言，我在該網站輸入「fox」搜尋結果，並點入了一張圖片：

　　紅框的部分除了「fox boy」不能用以外，其他都可以加入到範例1的.txt檔案中。參考了幾張有狐狸的圖片後，我將範例1的.txt內容調整如下：

animal_focus = 圖片中有動物角色
fox = 狐狸
animal_feet = 動物腳
yellow_eyes = 黃色/金色眼睛
flaming_eye = 單眼冒出火焰的特效，雙眼請用 flaming_eyes
fluffy = 蓬鬆毛茸茸
lavender_(flower) = 薰衣草花，直接沿用了Danbooru網站的關鍵字格式

　　我也遵照AI生成的關鍵字格式，單個關鍵字的空白以「_」取代（例：flaming_eye），不過使用訓練出來的LoRA、LoCon模型來生圖時，Prompts中直接使用空白即可。

以下是調整後的範例2的.txt內容：

Lu_Ashkol/Eye_Ashkol = 角色名字
*如訓練特定角色模型，以Danbooru格式輸入該角色的英文名會非常有助益。
child = 小孩
female_child = 小女孩 -- 千萬不要使用「loli」，除非想生成「壞壞」的圖片。
flat_chest = 平胸
multicolored_eyes = 多色眼睛
two-tone_hair = 雙色髮色
multicolored_hair = 多色髮色
streaked_hair = 挑染髮色
off-shoulder_shirt = 平口露肩上衣
frilled_sleeves = 摺邊袖
bare_shoulder = 露肩
shoulder_strap = 肩帶
collarbone = 鎖骨
bangs = 瀏海
interlocked_fingers = 十指交扣

＊範例2的雙胞胎故事：
有興趣的話，歡迎前往KadoKado閱讀喔（自產自推）。

︾黑米BR的沙龍︽AI紀行LoRA︾黑米BR的沙龍︽AI紀行Stable Diffusion總攬

留言

︾黑米BR的沙龍︽

82會員

106內容數

筆者探索各種感興趣事物的紀錄。 *副帳非主流政治沙龍《黑米BR不政確》：https://vocus.cc/user/@BRriceP

︾黑米BR的沙龍︽的其他內容

2023/11/01

《M.O.N》書封製作 | Stable Diffusion

筆者最近開啟連載的小說《M.O.N》是以AI、仿生人、安寧療護為主軸的科幻短篇。書封，按照慣例，是自製；也按照慣例，使用了Stable Diffusion (SD)。

2023/11/01

《M.O.N》書封製作 | Stable Diffusion

筆者最近開啟連載的小說《M.O.N》是以AI、仿生人、安寧療護為主軸的科幻短篇。書封，按照慣例，是自製；也按照慣例，使用了Stable Diffusion (SD)。

2023/10/04

徵集意見 | Stable Diffusion

實際上，筆者的Stable Diffusion (Vlad)依舊有些問題，仍不曉得原因是顯卡、Win11、SSD、Vlad或其他，但會先從更新顯卡驅動和重裝Vlad開始找錯。現況是Vlad運算了二三張圖後就會因為GPU記憶體不夠的問題開始極度緩慢，因此打擊了我創圖的意願。另一方面，也是對創作

2023/10/04

徵集意見 | Stable Diffusion

2023/09/20

最近重看了一部經典動畫｜ Stable Diffusion

想著有一陣子沒碰SD，就生成了一張繪圖來致敬。

2023/09/20

最近重看了一部經典動畫｜ Stable Diffusion

想著有一陣子沒碰SD，就生成了一張繪圖來致敬。

看更多

你可能也想看

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11