下面是一個 完整、實際可操作的「武俠 AI 圖像模型訓練流程」。
這套流程是目前獨立創作者常用的方法:Stable Diffusion + LoRA 微調。
好處是 家用 GPU(如 4090)就能完成。一、整體架構(武俠 AI 圖像模型)
核心基礎模型:
- Stable Diffusion XL
訓練方式:
Base Model (SDXL)
+
LoRA (武俠風格)
+
LoRA (角色)
+
LoRA (場景)
最後生成能力:
唐代武俠人物
+
華山
+
絲路商隊
+
唐宮
二、整體訓練流程(8 步)
完整 pipeline:
1 準備基礎模型
2 收集武俠資料集
3 整理圖片
4 自動生成標籤
5 設定訓練環境
6 訓練 LoRA
7 測試生成
8 疊加模型
三、Step 1
準備基礎模型
下載基礎模型:
- Stable Diffusion XL
來源:
- Hugging Face
例如:
stabilityai/stable-diffusion-xl-base-1.0
四、Step 2
收集武俠資料集
這是 最重要的一步。
建議數量:

總計:
600–1000 張
來源:
- 電影截圖
- 武俠插畫
- AI生成圖片
- 歷史插畫
例子:
Tang dynasty warrior
Chinese swordsman
wuxia heroine
ancient chinese armor
martial arts fight
五、Step 3
圖片整理
統一尺寸:
1024 × 1024
資料夾結構:
dataset/
wuxia_style/
001.png
002.png
003.png
tang_dynasty/
001.png
002.png
martial_arts/
001.png
工具:
- Bulk Resize Photos
六、Step 4
自動生成圖片標籤
AI 產圖模型需要 caption。
例如:
Tang dynasty swordsman
long hair
ancient chinese armor
wuxia style
自動標籤工具:
- BLIP
- DeepDanbooru
生成格式:
001.png
001.txt
內容:Tang dynasty warrior, wuxia style
七、Step 5
安裝訓練環境
推薦訓練工具:
- kohya-ss
GitHub:
git clone https://github.com/kohya-ss/sd-scripts
安裝依賴:
pip install torch torchvision
pip install accelerate
pip install diffusers
GPU:
RTX 4090
或
RTX 3060 12GB
八、Step 6
訓練 LoRA 模型
訓練命令示例:
accelerate launch train_network.py \
--pretrained_model_name_or_path=sdxl \
--train_data_dir=dataset \
--resolution=1024 \
--output_dir=lora_output \
--network_dim=128 \
--train_batch_size=2 \
--max_train_steps=2000 \
--learning_rate=1e-4
重要參數:

推薦:
2000 – 6000 steps
訓練時間:
























