前一篇探討了如何用ChatGPT、Gemini輔助創作真人風格照片,達到半自動化的生成提示詞的方法。這一篇會進一步介紹動漫風格圖片的流程。
第一步首先會打開預存好提示詞的語言模型。(在ChatGPT裡面叫GPTs,在Gemini裡面是叫Gem)。以Gemini為例,介面如下圖:

如圖所示我們可以首先輸入初始的需求,例如「紅髮雙馬尾的女孩,身著冒險者服飾拿著雙刀」。
接著Gemini就會構思要怎麼引導使用者明確自己的需求(如下圖)

雖然問卷內容有點長但還是讓大家看一下:
#### **A. 主體設定 (Character Details)**
1. **情緒與視線 (Emotion & Gaze):**
1. 自信的微笑,直視鏡頭,充滿挑釁。
2. 專注而嚴肅的表情,視線望向畫面外,彷彿在偵查敵人。
3. 戰鬥後的喘息,眼神略帶疲憊但充滿決心。
4. 充滿活力的吶喊,眼神鎖定前方。
2. **姿勢 (Pose):**
1. 動態的攻擊姿態,雙刀交叉於胸前準備防禦或攻擊。
2. 將一把刀扛在肩上,另一把垂下,帥氣地站立。
3. 蹲伏在屋頂或樹枝上,準備從高處突襲。
4. 高速奔跑中,雙刀在身後留下殘影。
3. **冒險者服飾細節 (Adventurer's Outfit Details):**
1. 經典奇幻風格:皮革護甲、金屬護肩與飄逸的披風。
2. 輕裝刺客風格:貼身的深色緊身衣、兜帽與皮帶。
3. 東方武者風格:改良式的武道服,配上護手與護腿。
4. 蒸汽龐克風格:包含齒輪、黃銅裝飾與護目鏡的服裝。
#### **B. 構圖與風格 (Composition & Style)**
4. **構圖 (Composition):**
1. 全身像,由下往上的仰視角,突顯角色的氣勢。
2. 半身像,水平視角,聚焦於角色的表情與上半身動作。
3. 動態全身像,廣角鏡頭,捕捉角色動作的張力。
5. **背景 (Background):**
1. 古老而神秘的廢棄神殿內部。
2. 夕陽下的廣闊草原,遠方有山脈。
3. 被魔法森林環繞的巨大發光水晶旁。
4. 龍之巢穴的入口,充滿了硫磺與岩漿。
6. **美術風格與光線 (Art Style & Lighting):**
1. 現代精緻插畫風格,光影對比強烈,色彩飽和度高。
2. 日系遊戲美術設定稿風格,線條乾淨,細節豐富。
3. 經典90年代賽璐璐動畫風格,色彩鮮明,陰影層次分明。
4. 厚塗繪畫風格,筆觸感強烈,充滿戲劇性的光線(例如來自下方的火光)。
接著你就把你選擇的結果,複製到對話窗內再次送給Gemini(如下圖)

接著他就會生成三組提示詞如下:
提案 1: 神殿的赤色火焰
這個提案專注於光影的戲劇性,強調從下方而來的火光如何照亮角色,營造強烈的視覺衝擊力。
英文提示詞: (best quality, masterpiece), 1girl, a girl with long red hair in twin-tails, wearing a dark form-fitting assassin bodysuit with a hood and belts, standing coolly with one sword resting on her shoulder, holding dual blades, confident and provocative smirk, looking directly at viewer, dynamic full body shot, wide angle, inside an ancient and mysterious ruined temple, dramatic lighting, strong rim light from a fire below, painterly style, strong and visible brushstrokes.
接著就把這個提示詞丟給平常在使用的模型即可。
(建議不要丟給Gemini自己做,審美不太合用↓↓↓)

恩...不能說醜,但不是我的菜(卡特可憐娜?)。
還是回去用illustrious吧!(Checkpoint:MultiStyle Variation A)
出來的圖如下:

好多了。
再多玩幾個例子吧。
初始提示詞「藍色長髮的女孩、水屬性魔導師。長袍+上衣+短百褶裙」

初始提示詞「綠色短髮女孩、獵人服飾。手持巨斧。」

恩...布料有點少,搭配冰天雪地看起來有夠冷。
總之,跟我自己手打提示詞比起來,畫面控制力偏弱,有點轉蛋感。
但就創作前期的快速試錯來說,真的很方便。
這套系統提示詞分享如下: