用 RTX 4090 在家訓練 Stable Diffusion 模型完整指南

更新 發佈閱讀 6 分鐘

以下是一個 在家用一張 RTX4090 訓練 Stable Diffusion 模型的完整實戰指南

目前很多獨立創作者、AI畫師、遊戲工作室在用的方法。 RTX4090(24GB VRAM)其實非常適合做這件事。 🚀


一、先理解:4090 能做到什麼

GPU:NVIDIA GeForce RTX 4090

能力大概如下:

raw-image

原因:

像 Stable Diffusion XL 這種模型本身需要 數百 GPU 訓練。

所以家用方式是:

Base Model
+
微調

二、4090 訓練的最佳方案

推薦架構:

Stable Diffusion XL
+
LoRA

LoRA = Low Rank Adaptation

優點:

  • 訓練快
  • VRAM需求低
  • 模型只有 50–200MB

三、硬體與系統要求

最低配置:

raw-image

系統:

Ubuntu 22.04

Windows 11

Linux會更穩定。


四、安裝 AI 訓練環境

安裝 Python:

Python 3.10

建立虛擬環境:

python -m venv sd_env

啟動:

Windows

sd_env\Scripts\activate

Linux

source sd_env/bin/activate

五、安裝訓練框架

目前最常用:

  • kohya-ss

下載:

git clone https://github.com/kohya-ss/sd-scripts
cd sd-scripts

安裝依賴:

pip install -r requirements.txt

安裝 PyTorch:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121

六、下載基礎模型

最常用:

  • Stable Diffusion XL

下載來源:

  • Hugging Face

模型:

sd_xl_base_1.0.safetensors

放到:

models/

七、準備訓練資料集

這是 最重要的一步

資料量建議:

raw-image

圖片規格:

1024x1024
PNG / JPG

資料夾:

dataset/
img1.png
img1.txt

八、建立圖片標籤

每張圖片需要 caption。

例:

Tang dynasty swordsman
wuxia warrior
ancient Chinese armor
dramatic lighting

自動標籤工具:

  • BLIP
  • DeepDanbooru

九、開始訓練 LoRA

範例命令:

accelerate launch train_network.py \
--pretrained_model_name_or_path=sdxl \
--train_data_dir=dataset \
--resolution=1024 \
--output_dir=lora \
--network_dim=128 \
--train_batch_size=2 \
--max_train_steps=3000 \
--learning_rate=1e-4

重要參數:

raw-image

建議:

30006000 steps

十、4090 訓練時間

以 300 張資料集為例:

raw-image

VRAM 使用:

18GB – 22GB

十一、測試模型

生成 UI:

  • AUTOMATIC1111
  • ComfyUI

Prompt:

Tang dynasty wuxia heroine
standing on mount huashan
dramatic lighting

載入 LoRA:

<lora:wuxia_style:1>

十二、進階玩法(高手)

加入:

  • ControlNet

可以控制:

raw-image

例如:

劍法姿勢
飛簷走壁
打鬥

十三、4090 能建立什麼 AI 系統

一張 4090 可以建立:

AI 武俠角色生成器
AI 古風場景生成器
AI 漫畫生成器
AI 遊戲角色生成器

甚至可以做:

AI 動畫
AI 漫畫
AI 電影分鏡

十四、4090 創作者典型 workflow

很多 AI 創作者 pipeline:

ChatGPT ↓PromptStable Diffusion

生成圖片ControlNet

控制姿勢Upscale

4K 圖像

十五、特別建議

如果計畫寫 唐玄宗武俠小說,其實可以做一件非常特別的事:

建立 「武俠世界 AI 模型」

資料集:

華山
敦煌
絲路商隊
唐宮
胡人武士
拜火教

角色:

公孫嫣
軋犖山
康延年

最後可以直接生成:

公孫嫣 standing on huashan cliff
Tang dynasty wuxia heroine

這等於 AI 把你的小說世界視覺化



留言
avatar-img
sirius數字沙龍
13會員
270內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/17
下面是一個 完整、實際可操作的「武俠 AI 圖像模型訓練流程」。 這套流程是目前獨立創作者常用的方法:Stable Diffusion + LoRA 微調。 好處是 家用 GPU(如 4090)就能完成。 一、整體架構(武俠 AI 圖像模型) 核心基礎模型: Stable Diffusion XL
Thumbnail
2026/03/17
下面是一個 完整、實際可操作的「武俠 AI 圖像模型訓練流程」。 這套流程是目前獨立創作者常用的方法:Stable Diffusion + LoRA 微調。 好處是 家用 GPU(如 4090)就能完成。 一、整體架構(武俠 AI 圖像模型) 核心基礎模型: Stable Diffusion XL
Thumbnail
2026/03/15
「宇宙渦旋」通常不是正式的單一學術名詞,而是用來形容一種在宇宙尺度上類似渦旋或旋轉缺陷的結構。最接近這個概念的理論物體是: Cosmic string(宇宙弦) 很多物理學家把它比喻為: 宇宙真空中的量子渦旋。 一、直觀理解:宇宙中的「旋轉缺陷」 想像宇宙在非常早期時: 溫度極高
Thumbnail
2026/03/15
「宇宙渦旋」通常不是正式的單一學術名詞,而是用來形容一種在宇宙尺度上類似渦旋或旋轉缺陷的結構。最接近這個概念的理論物體是: Cosmic string(宇宙弦) 很多物理學家把它比喻為: 宇宙真空中的量子渦旋。 一、直觀理解:宇宙中的「旋轉缺陷」 想像宇宙在非常早期時: 溫度極高
Thumbnail
2026/02/06
社群幣(Community Token / Meme Token / DAO Token)是目前最容易、成本最低、成功率最高的一種發幣模式。 實務上你 完全不需要自己做區塊鏈,只要: ✅ 發 ERC-20 / BEP-20 代幣 ✅ 上 DEX(Uniswap / PancakeSwap)
Thumbnail
2026/02/06
社群幣(Community Token / Meme Token / DAO Token)是目前最容易、成本最低、成功率最高的一種發幣模式。 實務上你 完全不需要自己做區塊鏈,只要: ✅ 發 ERC-20 / BEP-20 代幣 ✅ 上 DEX(Uniswap / PancakeSwap)
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
這篇是語氣角色創作筆記的開場文。從《我才不是你養的貓》到《彼得與我》,我一直在做的,是「角色不跑掉」的語氣導戲。這裡將展開一個角色宇宙,每位角色都會逐一登場。
Thumbnail
這篇是語氣角色創作筆記的開場文。從《我才不是你養的貓》到《彼得與我》,我一直在做的,是「角色不跑掉」的語氣導戲。這裡將展開一個角色宇宙,每位角色都會逐一登場。
Thumbnail
順利完成今年第一部短篇《寫作遊戲》後的碎碎念。 如果你正好也走在創作的路上,這篇或許會對你有點助益。
Thumbnail
順利完成今年第一部短篇《寫作遊戲》後的碎碎念。 如果你正好也走在創作的路上,這篇或許會對你有點助益。
Thumbnail
這是一篇對太宰的角色分析筆記。算是自用加分享。如果有幫到需要的人更好^^
Thumbnail
這是一篇對太宰的角色分析筆記。算是自用加分享。如果有幫到需要的人更好^^
Thumbnail
徐導的作品《黃金人生 Crystal》及其探索家族關係和自我覺察的過程。透過舞臺劇,觀眾能夠在幽默中思考家庭議題與自我認同,而創作者自己,也在創作的過程中,面對自我提問和自我質疑,找到自己的出口。
Thumbnail
徐導的作品《黃金人生 Crystal》及其探索家族關係和自我覺察的過程。透過舞臺劇,觀眾能夠在幽默中思考家庭議題與自我認同,而創作者自己,也在創作的過程中,面對自我提問和自我質疑,找到自己的出口。
Thumbnail
「我的角色就是會/不會這樣做!」 我想是許多GM害怕聽到的話。 當聽到這句話時,許多時候也是場外氣氛處於一觸即發的狀況,所以我們GM帶團時,會極力祈禱避免遇上這種狀況。 也因此,當GM轉為當玩家時,或許也會提醒自己「不要成為這種玩家!」。 只是,真的不能堅持角色的想法或設定嗎?
Thumbnail
「我的角色就是會/不會這樣做!」 我想是許多GM害怕聽到的話。 當聽到這句話時,許多時候也是場外氣氛處於一觸即發的狀況,所以我們GM帶團時,會極力祈禱避免遇上這種狀況。 也因此,當GM轉為當玩家時,或許也會提醒自己「不要成為這種玩家!」。 只是,真的不能堅持角色的想法或設定嗎?
Thumbnail
當我們身為讀者時,可以很任性的看自己想看的部分,選擇自己想要的次類型,但編劇與小說家是創作領域的專家,自然需要知道為什麼要創作,要創作出什麼作品,要借用作品傳達出什麼樣的資訊,獲得資訊的人們所做出的反應是否有達到創作所想要的效果,這都是創作者需要面對的自問自答。
Thumbnail
當我們身為讀者時,可以很任性的看自己想看的部分,選擇自己想要的次類型,但編劇與小說家是創作領域的專家,自然需要知道為什麼要創作,要創作出什麼作品,要借用作品傳達出什麼樣的資訊,獲得資訊的人們所做出的反應是否有達到創作所想要的效果,這都是創作者需要面對的自問自答。
Thumbnail
遇到臉書自動推播實際大學推廣部的漫畫家講座課程,參加體驗課程後覺得滿有趣的,想學習怎麼畫漫畫的,於是報名了正式課程。畫作業感覺很挫折! 課程很精實,前面1-1.5小時,主要是日本老師示範,後面留半小時逐一檢討作業。
Thumbnail
遇到臉書自動推播實際大學推廣部的漫畫家講座課程,參加體驗課程後覺得滿有趣的,想學習怎麼畫漫畫的,於是報名了正式課程。畫作業感覺很挫折! 課程很精實,前面1-1.5小時,主要是日本老師示範,後面留半小時逐一檢討作業。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News