讓想像成為現實
在這篇文章中,我們將探討如何使用 Stable Diffusion (以下簡稱 SD) 設計你想像中的角色。SD 是一款功能強大的 AI 繪圖工具,支援 文生圖 (Text-to-Image)、圖像重繪 (Inpaint)、圖生圖 (Image-to-Image),以及 自訂模型與風格。這意味著使用者可以載入自訂的 Checkpoint 模型或 Lora 模型(例如針對特定風格或主題的模型),更精準地生成想要的圖像,並實現個性化的創作。SD 支援多平台運行,包括本地端和線上平台(如 Tensor.art、Hugging Face 等),其應用範圍非常廣泛,無論是創作角色設計、風景圖像還是插畫,都能輕鬆實現。
我喜歡設定一個標的進行教學,因此本篇預設可以讓讀者參照本篇的概念設計出一個自己喜歡的角色圖像,為了讓還未安裝SD的朋友也能體驗,以下步驟全都能在tensor.art實現。
第一步:選擇 Checkpoint
Checkpoint 是 SD 的核心,它是經過大量圖像數據訓練後的模型檔案,包含了許多權重參數,根據提示詞生成特定風格或類型的圖像。簡單來說,Checkpoint 決定了 AI 的「能力範圍」,影響最終生成圖像的風格與品質。
在開始設計角色之前,你需要選擇合適的 Checkpoint。想清楚你要設計的角色風格是什麼:
- 3D、2.5D、卡通還是寫實風格?
- 如果不確定,推薦你可以到 Civitai(網友常說的 C站)搜尋,這裡有很多現成的模型可以選擇。
- 如果圖片將用於商業用途,記得確認每個模型的版權宣告。
下面我推薦幾款,各位可以快速先選一款當測試。
不同的 Checkpoint 對提示詞的理解能力可能不同。例如動漫風模型擅長生成二次元角色,寫實模型更擅長生成類似照片圖像。
第二步:輸入提示詞(Prompt)
提示詞就是給 AI 的「創作指令」,它會決定最終圖像的內容和風格,提示詞輸入就像我告訴AI這張圖要畫成什麼樣,主體是誰,他呈現什麼姿勢或裝飾,他在什麼場地或他的背景是什麼,背景中有什麼。但注意即使使用相同的提示詞,在不同的 Checkpoint 也會產生截然不同的效果。
提示詞書寫規則
提示詞輸入順序非常重要。AI 模型會優先解析提示詞中的前幾個單詞,並根據這些詞語來確定圖像的調性,因此一串提示詞越靠前的資訊越重要,我建議提示詞在書寫時,遵守下列規則
主體→細節補充→背景與場景→細節強化
提示詞書寫:
- 主體(角色定位):首先,明確角色的基本特徵。這是提示詞中最重要的部分,因為模型會給這部分更高的權重。
- 細節補充:描述角色的外觀、服裝、表情等細節。這些能幫助 AI 更具體地理解角色的形象。
- 背景與場景:再加入背景的描述,例如角色所處的環境、氛圍等。
- 細節強化:最後,強調一些額外的細節或特徵來加強圖像的效果。
這個規律,主體越靠前,模型會賦予它更高的權重,靠前的提示詞更有可能會成為圖像的焦點,若把不重要的細節放在前面,主題可能會被弱化或忽略。
示範對比
示例 1:主題清晰、主體靠前
"a mystical elf archer, long silver hair, wearing enchanted armor, standing in a glowing forest, cinematic lighting, highly detailed"
- 主體:mystical elf archer(強調主題是「精靈弓箭手」)
- 修飾語:long silver hair, wearing enchanted armor(補充角色特徵)
- 背景與風格:standing in a glowing forest, cinematic lighting(補充氛圍與細節)
示例 2:主題模糊、描述順序混亂
"long silver hair, glowing forest, enchanted armor, a mystical elf archer"
- 問題:模型可能更關注「銀髮」和「森林」,角色定位不夠清晰。
實作練習
概念到這邊,我們來實作一下吧,請在下列選好提示詞。
(1)角色類型(主體)
- 性別:male, female,
- 年齡:teenager, young adult, middle-aged
- 種族:human, elf, robot,
(2)外觀特徵(細節補充)
- 髮型:long curly hair, short spiky hair, braided hair,
- 髮色:blonde, silver, gradient blue,
- 膚色:pale, tanned, dark skin,
- 其他細節:freckles, scar on cheek, glowing eyes,
(3)服裝設計(細節補充)
- 風格:modern casual, medieval knight, cyberpunk,
- 顏色主題:red and gold, pastel pink, monochrome,
- 配件:leather gloves, futuristic helmet, magical staff,
(4)表情與動作(細節補充)
- 表情:confident smile, sad gaze, angry shouting,
- 動作:sitting on a throne, drawing a sword, floating mid-air,
(5)背景(背景與場景)
- 簡單背景:white background, solid pastel colors,
- 複雜背景:mystical forest, bustling city at night, outer space,
請在上述選好提示詞,遵守(主體→細節補充→背景與場景)規則
,寫出一段提示詞,例如
範例提示詞 : female,teenager,elf,long curly hair,blonde,pale,glowing eyes,modern casual,pastel pink,confident smile,drawing a sword,outer space,
※每個提示詞請用 , 隔開,避免AI混淆,FLUX模型較無這問題
完成後,你只需要將這段提示詞輸入到 AI 模型中,就能根據你的設計生成圖像。