Gemini 繪圖教學:如何優化提示詞,讓 AI 生成的 Q 版肖像「神似本人」?

更新 發佈閱讀 13 分鐘

嗨,我是 Lun。

你是否也曾興沖沖地拿著自己或朋友的照片,想讓 AI 生成一張可愛的 Q 版頭像,結果卻得到一個「請問您哪位?」的陌生臉孔?


風格化」與「相似度」的平衡,一直是 AI 圖像生成中最困難的挑戰之一。

今天,我將與你分享一次完整的實戰紀錄。我如何利用 Google AI Studio 中最新的 Gemini 2.5 Flash Image Preview 模型,透過 4 個階段的迭代,將一段最初的想法,進化成一組能精準生成「神似本人」Q 版 3D 婚紗照的黃金提示詞。

這不只是一篇教學,這是我作為一名 AI 應用策略顧問的完整思考路徑。



階段一:原始提示詞 (Raw Prompt) - 充滿想法的草稿


一切都始於一個美好的願望:將一張婚紗照,變成帶有中式古風的 Q 版 3D 人物。我把所有能想到的細節都告訴了 AI:

【原始版本】 將照片里的兩個人轉換成Q版 3D人物,中式古裝婚禮,大紅顏色,背景“囍”字剪紙風格圖案。 服飾要求:寫實,男士身著長袍馬褂,主體為紅色,上面以金色繡龍紋圖案,彰顯尊貴大氣 ,胸前系著大紅花,寓意喜慶吉祥。女士所穿是秀禾服,同樣以紅色為基調,飾有精美的金色花紋與鳳凰刺繡,展現出典雅華麗之感 ,頭上搭配花朵發飾,增添柔美溫婉氣質...

raw-image


結果分析: 這個版本雖然資訊豐富,但問題非常明顯:

  1. 缺乏結構:所有資訊混雜在一起,AI 難以區分主次。
  2. 語意模糊:充滿了「尊貴大氣」、「柔美溫婉」等 AI 難以理解的形容詞。
  3. 核心缺陷:完全沒有提及要參考原始照片的「臉部特徵」,AI 根本不知道要畫得像誰,這是導致「不像」的根本原因。


階段二:第一次優化 - 結構化與引入「相似度」概念


為了解決問題,我與我的「生成式AI提示詞優化工程師 v1.0」分身進行了第一次優化,將提示詞結構化,並首次加入了「臉部特徵」的指令。

【第一次優化版本】 目標: 生成一張高度風格化的中式古風婚禮主題插畫... 風格與場景:

  1. 圖像風格: 採用Q版(Chibi)與3D混合風格,融合**手辦(Figure)黏土公仔(Clay doll)**的質地感... 人物設定:
  • 人物臉部(Facial Features): 儘可能在Q版風格的基礎上,精準捕捉與呈現原始照片人物的臉部特徵...
raw-image


結果分析: 這次的進步是巨大的:

  • 結構清晰:AI 能更好地理解不同層面的要求。
  • 指令具體:用「手辦」、「黏土公仔」鎖定了風格,比單純的 Q 版 3D 更精準。
  • 方向正確:首次引入了「相似度」概念,讓 AI 開始嘗試模仿原始照片。

但問題依然存在:「相似度」的指令不夠強勢,在 AI 的內部計算中,可能被「Q版化」的風格指令蓋過,導致臉部還原度依然不足。



階段三:第二次優化 - 確立核心,解決衝突(最終版)


這一步是整個優化的「勝負手」。我們必須徹底解決「風格」與「相似度」的衝突,將「長得像」提升為最高優先級。

【最終優化版本】 指令核心: 在Q版3D風格的基礎上,最大化人物與原始照片的肖像相似度(Likeness)

目標: 其五官、髮型及神態應極度相似於(Highly Resemble)原始照片中的人物...

人物設定:

  • 人物臉部(Facial Features): 這是本次任務的最高優先級(Highest Priority)。請精準復刻(Precisely Replicate)原始照片中人物的臉部細節與神韻... 此項要求凌駕於純粹的Q版化風格,以確保人物的可辨識性(Recognizability)

關鍵提示詞(Keywords):

  • 高相似度(High Likeness), 肖像(Portrait), 神似(Highly Resemble), 可辨識(Recognizable)...
raw-image


結果分析: 這個版本之所以能成功,關鍵在於三大策略:

  1. 確立最高優先級:開宗明義,告訴 AI 「相似度」是本次任務的唯一核心,解決了指令權重不明的問題。
  2. 專業詞彙強化:引入 Likeness, Portrait, Resemble, Recognizable 等專業詞彙,形成緊密的語意場,讓 AI 徹底理解「相似」的深層意涵。
  3. 解決風格衝突:用「此項要求凌駕於純粹的Q版化風格」這句指令,直接為 AI 設立了判斷原則,有效地控制了最終結果。


最終版提示詞:


您好,請根據以下提示詞生成圖像:
**指令核心:** 在Q版3D風格的基礎上,最大化人物與**原始照片的肖像相似度(Likeness)**
**目標:** 生成一張**高度風格化(Highly Stylized)****中式古風婚禮主題插畫**
畫面核心為一對Q版3D新婚夫婦,其五官、髮型及神態應**極度相似於(Highly Resemble)**原始照片中的人物,同時保有Q版風格的可愛與立體感。
**圖像風格與場景:**
1. **風格(Style):** **Q版(Chibi)****3D(Three-dimensional)**混合,融合**手辦(Figure)****黏土公仔(Clay doll)****卡通化人像(Caricature Portrait)**的質感,以達到既可愛又神似的獨特效果。
2. **主題與色調(Theme & Color Palette):** **中式古裝婚禮(Traditional Chinese wedding)**,主色調為**大紅色(Vivid Red)****金色(Gold)**
3. **背景(Background):** 採用**剪紙藝術(Paper-cut art)**風格的**「囍」字圖案**,此圖案需具備**多層次與景深(Multi-layered and with depth)**,而非單一平面。
**人物設定(Characters):**
- **人物數量:** 兩位,一男一女。
- **人物臉部(Facial Features):** 這是本次任務的**最高優先級(Highest Priority)**。請**精準復刻(Precisely Replicate)**原始照片中人物的**臉部細節與神韻**,包含但不限於:**臉型、眉毛、眼睛、鼻型、嘴型及髮型**。此項要求凌駕於純粹的Q版化風格,以確保人物的**可辨識性(Recognizability)**
- **人物姿態:** 兩人應呈現親密、喜慶的互動姿態,例如並肩而立、手牽手或相視而笑。 **服飾與裝飾細節(Attire & Accessories):
** 1. **男士服飾:**
- **類型:** **中式長袍馬褂**,主體為**大紅色**
- **圖案:** 表面以**金色繡線**繡上**精緻且寫實的龍紋圖案(Realistic dragon motifs)**
- **胸前裝飾:** 系著一朵**大紅花**
- **頭飾:** **中式狀元帽**,帽體紅色,飾有金色紋樣,帽頂有精緻金色裝飾。
2. **女士服飾:** - **類型:** **秀禾服(Xiuhe suit)**,主體為**大紅色**
- **圖案:** 飾有**精美的金色花紋****鳳凰刺繡(Phoenix embroidery)**
- **頭飾:** **鳳冠(Phoenix coronet)**造型,以**紅色花朵**為中心,搭配**金色立體裝飾****垂墜流蘇(Tassel)**
- **共同特點:** 服裝與頭飾需**細膩寫實(Highly Detailed and Realistic)**地呈現其材質與紋理,同時與人物Q版化風格協調。
**關鍵提示詞(Keywords):**
- **高相似度(High Likeness)**, **肖像(Portrait)**, **神似(Highly Resemble)**, **可辨識(Recognizable)**
- Q版, 3D, 卡通化人像(Caricature Portrait), 手辦, 黏土公仔
- 中式古風, 古裝, 婚禮, 大紅色, 金色, 囍 - 剪紙風格, 立體感, 多層次
- 長袍馬褂, 龍紋, 秀禾服, 鳳凰刺繡
- 狀元帽, 鳳冠, 垂墜流蘇
- 藝術插畫(Illustration), 傑作(Masterpiece)

給你後續的延伸動作的提示詞

選項一:甜蜜對視(Sweet Gaze)

這個指令適用於營造浪漫、深情的氛圍。

人物姿態(Characters' Poses):
兩人深情地對視而笑,男士輕輕牽起女士的手,營造出浪漫且充滿愛意的瞬間。


選項二:活潑互動(Playful Interaction)

這個指令適合想要展現新人活潑、開朗個性,營造俏皮氛圍的圖像。

人物姿態(Characters' Poses):
兩人俏皮地互相依偎,女士輕輕地將頭靠在男士肩上,男士則以溫柔的微笑注視著前方。整體姿勢輕鬆自然,充滿歡樂氣氛。


選項三:傳統莊重(Formal & Traditional)

這個指令適合追求古典、莊重感的圖像,模擬傳統中式婚禮的儀式感。

人物姿態(Characters' Poses):
兩人端莊地並肩而立,雙手自然垂放或輕輕交握,面帶微笑望向前方,呈現出莊重而典雅的傳統中式婚禮儀式感。

選項四:互動式小物(Interactive Props)

這個指令能為畫面增添細節和互動性,使場景更加生動。

人物姿態(Characters' Poses):
兩人共同手持一個具有象徵意義的中式婚禮小物,如一對精緻的紅燈籠、一把喜慶的紅色紙傘,或是一塊寫著「囍」字的扇子。他們可以一起注視著這個小物,或是互相對看並微笑。


選項五:動態捕捉(Dynamic Capture)

這個指令能營造出充滿動感和歡樂氣氛的畫面,彷彿在捕捉一個瞬間。

人物姿態(Characters' Poses):
兩人呈現出歡樂奔跑或輕快小跳的動態姿勢,服飾與髮飾因動作而輕微飄動。女士可以輕輕地提著裙擺,展現出俏皮與輕盈感,同時兩人回頭對鏡頭露出燦爛笑容。


選項六:背景融入(Background Integration)

這個指令讓人物不僅僅是站在背景前,而是與背景元素產生有趣的互動。

人物姿態(Characters' Poses):
兩人並肩站立,其中一人(例如男士)用手指輕輕觸碰或指向背景的「囍」字剪紙圖案,另一人(女士)則用手遮住嘴巴,露出甜美的笑聲。這種互動讓背景不再單調,而是成為故事的一部分。



加碼測試:

同樣的提示詞你也可以拿去GPT5測試唷,你會得到意想不到的圖片,嘿嘿

總結:從想法到指令的進化之路

這三組提示詞代表了從模糊意圖精準指令的逐步優化過程。

  • 第一組是初級的通用描述,缺乏細節和權重。
  • 第二組開始意識到問題並試圖解決,但方法不夠強勢。
  • 第三組則透過第一性原理批判性思考,準確地找到了問題的核心(缺乏相似度指令的權重),並運用多重專業詞彙、明確的優先級設定風格對比等技巧,從根本上解決了問題,使其成為一個能高效引導 AI 生成預期效果的優質提示詞
  1. 原始版:初級的通用描述,缺乏細節和權重。
  2. 優化版1結構清晰,引入相似度相似度指令權重不足
  3. 優化版2確立核心,解決衝突(已解決)


從這個案例我們可以看到,雖然AI 模型未來勢必會愈來愈茖明,但是至少在短期內,優化提示詞也是相當重要。



一個優質的提示詞,需要將模糊的人類需求,翻譯成清晰、高效、無歧義的機器指令。


希望這次的實戰紀錄,能對同樣在為 AI 繪圖「不像本人」而苦惱的你,帶來一些啟發。


你在 AI 繪圖時,遇過最頭痛的問題是什麼?歡迎在底下留言分享!

留言
avatar-img
留言分享你的想法!
avatar-img
Lun.AI 🤖 玩轉 AI ⚡️
3會員
21內容數
Lun.AI 🤖 玩轉 AI、聰明解題 ⚡️ 以人人都能懂的方式,普及 AI 應用,讓技術真正服務於人的真實需求。 堅持用最平易近人的方式溝通,掃除學習障礙。 團隊 AI 賦能 · 培訓 × 工具 × 實戰✨ 從焦慮到上手,打造可落地的 AI 能力 👇 Lun.AI 🤖 教你 #AI實作 #學習&職場升級 💪
2025/08/28
一位 ENFJ-T 型人格的作者利用 AI 作為個人成長策略長,探索自我成長,並分享其利用 AI 制定個人成長策略的經驗和方法,包含設定影響力宣言、最小可行進度 (MVP)、價值階梯和策略性慷慨等策略,協助個人平衡理想與現實,實現個人和事業的雙重成長。
Thumbnail
2025/08/28
一位 ENFJ-T 型人格的作者利用 AI 作為個人成長策略長,探索自我成長,並分享其利用 AI 制定個人成長策略的經驗和方法,包含設定影響力宣言、最小可行進度 (MVP)、價值階梯和策略性慷慨等策略,協助個人平衡理想與現實,實現個人和事業的雙重成長。
Thumbnail
2025/08/27
本文分享使用Gemini、GPT5、Manus三個AI繪圖工具,根據創意公式(角色設定+正在做什麼+在什麼地方+藝術風格+特殊氛圍)創作長毛垂耳兔NuNu不同風格的圖片,並分析比較各AI的表現,以及解決角色一致性問題的策略。
Thumbnail
2025/08/27
本文分享使用Gemini、GPT5、Manus三個AI繪圖工具,根據創意公式(角色設定+正在做什麼+在什麼地方+藝術風格+特殊氛圍)創作長毛垂耳兔NuNu不同風格的圖片,並分析比較各AI的表現,以及解決角色一致性問題的策略。
Thumbnail
2025/08/27
嗨,我是 Lun.AI AI 繪圖能讓我們一秒上太空、下一秒入魔界,但它有個難以言喻的痛: 「我無法讓我的主角,在第二張圖裡長得跟第一張一樣。」 「每次打指令總是要不到我們想要的樣子。」 這就是「AI 繪圖」的挑戰。 一切的開端,是 Google 昨天發表了一篇關於 Gemini
Thumbnail
2025/08/27
嗨,我是 Lun.AI AI 繪圖能讓我們一秒上太空、下一秒入魔界,但它有個難以言喻的痛: 「我無法讓我的主角,在第二張圖裡長得跟第一張一樣。」 「每次打指令總是要不到我們想要的樣子。」 這就是「AI 繪圖」的挑戰。 一切的開端,是 Google 昨天發表了一篇關於 Gemini
Thumbnail
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
這份筆記整理了AI常見Prompt,幫助你產生更符合需求的圖片。文章包含了比較常用的攝影詞彙、攝影風格、鏡頭、畫面光線詞彙、輔助詞彙、畫面遠近、動畫詞彙、音樂標籤等,並提供了參考資料來源。
Thumbnail
這份筆記整理了AI常見Prompt,幫助你產生更符合需求的圖片。文章包含了比較常用的攝影詞彙、攝影風格、鏡頭、畫面光線詞彙、輔助詞彙、畫面遠近、動畫詞彙、音樂標籤等,並提供了參考資料來源。
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
很快地,又來到了本週的說話時間。 接續上星期的話題,這個星期我和洪七在聊天中討論的是,如何運用GPT製作有畫面、有意義、有衝擊感又有記憶點的節目封面圖。內含:如何規避版權問題?若不透過臨摹,不輸入原始圖片,該如何讓AI自己畫出超擬真圖片? 聊到這件事的緣由是,我們自己的節目,起初是上傳到Firs
Thumbnail
很快地,又來到了本週的說話時間。 接續上星期的話題,這個星期我和洪七在聊天中討論的是,如何運用GPT製作有畫面、有意義、有衝擊感又有記憶點的節目封面圖。內含:如何規避版權問題?若不透過臨摹,不輸入原始圖片,該如何讓AI自己畫出超擬真圖片? 聊到這件事的緣由是,我們自己的節目,起初是上傳到Firs
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News