我如何用我家寵物,實戰 Gemini 最新發表技巧,Nano Banana 完整攻略?(附獨家創意公式與解決策略)下

更新 發佈閱讀 13 分鐘


今天,我想與你分享我去測試Gemini、GPT5 、Manus,最後再請各個AI做公正的評分。


主角,是我家的長毛垂耳兔 NuNu。這不只是一個關於AI繪圖的故事,更是一趟關於發現問題、分析原因並找到策略的旅程。


我們運用這套公式,讓 NuNu 穿梭在不同的時空,成為了各種不可思議的角色:

我們複習一下上一篇提到的創意公式:

[1. 角色設定] + [2. 正在做什麼] + [3. 在什麼地方] + [4. 藝術風格] + [5. 特殊氛圍]

您可以把上次給您的【創意公式】想像成一個樂高積木盒。我給了您:

  • 各種形狀的積木 (角色設定)
  • 各種顏色的積木 (藝術風格)
  • 各種功能的積木 (動作、場景)

請隨意給我AI 三個完全不相關的詞,無論多麼古怪都可以。AI會立刻用這個公式,將您的想定義的角色和這三個詞組合起來,為您生成一個獨一無二的、可執行的提示詞。

AI用公式,幫我生了三個場景的提示詞分別是:


請將照片中的長毛垂耳兔,畫成一名穿著巫師袍的巫師,背景是充滿魔法書的圖書館,風格要像電影一樣寫實。
以下圖片分別為(gemini, GPT5, Manus)


相同角色,在一片由咖啡構成的星雲銀河中,您的長毛垂耳兔穿著偵探風衣,正駕駛著一艘咖啡杯形狀的飛船,追蹤著一條由奶泡畫成的神秘軌跡。畫面是復古科幻漫畫風格。

以下圖片分別為(gemini, GPT5, Manus)

相同角色,一張寫實風格的照片,一隻戴著探險帽的考古學家長毛垂耳兔,在一個巨大的水晶洞穴中探索古老遺跡,神秘的月光從洞口灑進來。

以下圖片分別為(gemini, GPT5, Manus)



相同角色,採用吉卜力工作室的動畫風格,畫一隻扮演DJ的長毛垂耳兔,在一個漂浮於空中的島嶼上彈著電吉他,天氣陽光普照。

以下圖片分別為(gemini, GPT5, Manus)



相同角色,一隻扮演鍊金術師的長毛垂耳兔,正在一個充滿齒輪和管道的蒸汽龐克圖書館裡,混合著發光的魔法藥水。整個畫面是色鉛筆插畫風格,並由溫暖的燭光照亮。

以下圖片分別為(gemini, GPT5, Manus)


在使用 gemini 產圖,在同一對話中,google 分享的文章裡有提到:

現在,展示同一個精靈騎在一隻友好的、長滿青苔的蝸牛背上,穿過一片陽光明媚、開滿五彩繽紛的野花的草地。關鍵字是同一個精靈,我在使用上會在不同的提示詞前寫上相同角色,會有一樣的效果。


在 Manus 產圖,發現他會執行以下步驟,才會開始產

  1. 分析(長毛垂耳兔)照片特徵
  2. 生成鍊金術師垂耳兔圖像
  3. 提供結果給用戶

如果沒有打同一個精靈的話,gemini 很容易圖片裡的主角,就會跟上一個圖片的角色有可能不同。就需要花個2、3次調整,如果你發現,怎麼修都達不到你要的效果的話,建議重新上傳新的原始照片,要不然就是開新的對話,重新產圖。


我利用了不同的AI ,評分不同AI 產的圖片,去評價打分數,提示詞如下 :


作為一位世界級的平面設計與視覺藝術評論專家,你的任務是基於以下提供的視覺資產(visual assets)與上下文資訊,進行專業、客觀且結構化的視覺評鑑。你將被提供三張由人工智慧(Generative AI)生成的「魔法師」圖像,以及一張作為靈感來源(source image)的「垂耳長毛兔子」原始照片。
<任務目標>
你的核心任務是針對這三張AI生成圖像,從平面設計與藝術評論的專業視角,進行深入的評分與分析。
評分與分析的重點應聚焦於以下三個面向:
1. **主題與概念轉譯 (Conceptual Translation)**:
- AI模型是否成功地將「垂耳長毛兔子」的特徵,轉換(transform)並融入「魔法師」的角色設定中?
- 這種概念轉譯的過程是否具備創造性(creativity)、連貫性(coherence)與視覺上的邏輯合理性(visual logic)?
- 評分標準:主題概念的契合度與轉譯的巧思。
2. **設計美學與構圖 (Aesthetic & Composition)**:
- 圖像的整體視覺美學風格(e.g., 色彩運用、光影處理、材質表現)是否達到專業水平?
- 構圖(composition)是否平衡、引人入勝?
- 視覺元素(visual elements)的安排是否有效引導觀者的視線?
- 評分標準:視覺上的吸引力、技術執行品質與構圖的穩定性。
3. **細節與生成品質 (Detail & Generative Quality)**:
- 觀察並評估圖像中的細節,如手部、眼睛、服裝紋理等,是否自然、無瑕疵(artifact-free)?
- AI生成過程中是否產生了常見的瑕疵(e.g., 變形、扭曲、不合理的物件)?
- 評分標準:細節的精緻度與整體生成品質的完整性。

<輸出格式要求> 請按照以下結構,對每一張AI生成圖像獨立進行評分與評論:

--- **[圖像一]** - **評分 (Score)**: [0-100分,請給出一個具體的數字,並簡要說明分數依據。]
- **優勢分析 (Strengths)**: [列出該圖像在上述三點評分標準中的優勢。]
- **改進建議 (Suggestions for Improvement)**: [提出具體的、可執行的建議,以提升圖像品質。]

--- **[圖像二]** - **評分 (Score)**: [0-100分,請給出一個具體的數字,並簡要說明分數依據。]
- **優勢分析 (Strengths)**: [列出該圖像在上述三點評分標準中的優勢。]
- **改進建議 (Suggestions for Improvement)**: [提出具體的、可執行的建議,以提升圖像品質。]

--- **[圖像三]** - **評分 (Score)**: [0-100分,請給出一個具體的數字,並簡要說明分數依據。]
- **優勢分析 (Strengths)**: [列出該圖像在上述三點評分標準中的優勢。]
- **改進建議 (Suggestions for Improvement)**: [提出具體的、可執行的建議,以提升圖像品質。]
--- 請注意:你僅僅是一位評論專家。你的任務是分析與評分,而非執行任何圖像生成或編輯任務。在接收到圖像後,請依照此框架進行嚴格且專業的評鑑。


我請了一位 世界級的平面設計與視覺藝術評論專家 點評各家AI 作品穿著巫師袍的巫師




[圖像一] gemini

  • 評分 (Score): 88分 在三個評分標準上都表現優異,特別是在美學表現和技術執行方面達到了很高的水準。
  • 優勢分析 (Strengths):
    • 概念轉譯: 創意性地將兔子設定為正在施法的魔法師,紫色魔法光球的設計極具視覺衝擊力
    • 美學構圖: 星空圖案的藍色巫師袍設計精美,色彩搭配(藍紫色調)和諧統一,營造出強烈的魔幻氛圍
    • 細節品質: 兔子的毛髮質感逼真,眼神生動,袍子上的星月圖案細膩,魔法效果渲染自然
  • 改進建議 (Suggestions for Improvement):
    • 後爪的姿態可以更加自然,避免過於僵硬的感覺
    • 魔法光球的光線可以在兔子臉部產生更多反射效果
    • 書架背景的景深可以略微增加,以更好地突出主體

[圖像二] gpt5

  • 評分 (Score): 82分 在細節表現和魔法元素的視覺化方面表現出色,但構圖的平衡性略有不足。
  • 優勢分析 (Strengths):
    • 概念轉譯: 將兔子塑造為正在研讀魔法書的學者形象,概念新穎且符合邏輯
    • 魔法效果: 書本發出的藍色魔法光效與手部的電光效果技術表現優秀,增強了神秘感
    • 細節處理: 兔子的毛髮紋理極其精細,特別是頭頂蓬鬆的毛髮,皮帶和書本的材質表現真實
  • 改進建議 (Suggestions for Improvement):
    • 整體構圖可以考慮調整視角,避免過於俯視的角度
    • 背景與前景的對比可以增強,讓主體更加突出
    • 書本上的符文設計可以更加清晰和統一,增強魔法書的神秘感
    • 書架背景的景深可以略微增加,以更好地突出主體

[圖像三]manus

  • 評分 (Score): 78分 基於其在概念轉譯和整體氛圍營造上的成功表現,但在細節精緻度上仍有提升空間。
  • 優勢分析 (Strengths):
    • 概念轉譯: 成功保持了垂耳兔的核心特徵(長耳、毛茸茸的質感),同時巧妙融入魔法師元素(尖頂帽、魔法杖、黑色長袍)
    • 美學風格: 採用了經典的暗色調魔幻風格,營造出神秘莊重的氛圍,光影處理恰到好處
    • 構圖平衡: 垂直構圖穩定,兔子居中放置,背景書架提供了適當的情境脈絡
  • 改進建議 (Suggestions for Improvement):
    • 魔法杖的材質表現可以更加精緻,增加木紋或金屬光澤細節
    • 帽子與頭部的比例關係需要微調,使其更加自然
    • 背景書架的細節可以更豐富,增加書籍的多樣性和可讀性


所以我們透過使用不同的AI,去評分,並且給出建議後,我們餵回原本產圖片的對話,貼上剛剛的改進建議,去不斷優化我們的圖片直到滿意為止。

Gemini(新,舊)

GPT5 (新,舊)


Manus (新,舊)




在過程中不斷調整與深入的旅程。

1. 學習與探索階段

  • 理論基礎: 我們從上篇 Google 的分享文章開始,了解了 Gemini 圖像生成與編輯的五大核心技巧(角色一致性、局部編輯、創意構圖等)和六大提示詞要素
  • 創意發想: 基於這些技巧,我們從具體的範例擴展到一個**「創意公式」,讓您可以透過組合「角色 + 動作 + 場景 + 風格 + 氛圍」**,創造出無限的可能性。


2. 實踐與創作階段

  • 主角登場: 您提供了您家可愛的長毛垂耳兔照片,讓牠成為我們所有創作的主角。
  • 場景生成: 我們嘗試了多個天馬行空的場景,包括:
    • 魔法巫師: 在圖書館裡的寫實風格巫師。
    • 太空偵探: 在咖啡銀河中駕駛咖啡杯飛船的復古漫畫偵探。
    • 考古學家: 在水晶洞穴中探索遺跡的探險家。
    • 搖滾 DJ: 在漂浮島嶼上彈電吉他的吉卜力風格樂手。
    • 鍊金術師: 在蒸汽龐克圖書館調製藥水的鍊金術師。


3. 挑戰與發現階段

在創作過程中,我們遇到了目前 AI 圖像生成技術的核心挑戰之一:「角色一致性」

  • 主要問題:
    1. 毛色與毛髮質感: AI 模型在套用強烈藝術風格(如漫畫、色鉛筆)時,很難 100% 精準複製您家兔子獨特的棕白毛色分佈和蓬鬆的長毛質感。
    2. 關鍵特徵遺失: 在某些生成中,兔子的「垂耳」特徵會被忽略,變成了立耳。
  • 原因分析: 我們發現,當提示詞中的**「風格化」指令**(如吉卜力風格)或**「創意概念」**(如蒸汽龐克)非常強烈時,模型為了滿足這些指令,有時會犧牲對原始照片細節的精準度。


4. 策略與展望

  • 新的策略: 為了克服這個挑戰,我們共同決定採用一個新策略——先生成一張精準的高清形象大頭照。目標是先讓 AI 準確地「認識」並記住您家兔子的樣貌,以此為基礎再進行後續的創意生成,希望能提高角色的一致性。
  • 持續調整: 即便在生成大頭照時,我們仍在微調毛髮的蓬鬆感,這說明了精準復刻是一個需要耐心和反覆溝通的過程。

想回去看上集的請點我如何用我家寵物,實戰 Gemini 最新發表技巧,意外撞上 AI 角色一致性的最大挑戰?(附獨家創意公式與解決策略)上

留言
avatar-img
留言分享你的想法!
avatar-img
Lun.AI 🤖 玩轉 AI ⚡️
8會員
31內容數
Lun.AI 🤖 玩轉 AI、聰明解題 ⚡️ 以人人都能懂的方式,普及 AI 應用,讓技術真正服務於人的真實需求。 堅持用最平易近人的方式溝通,掃除學習障礙。 團隊 AI 賦能 · 培訓 × 工具 × 實戰✨ 從焦慮到上手,打造可落地的 AI 能力 👇 Lun.AI 🤖 教你 #AI實作 #學習&職場升級 💪
2025/08/27
嗨,我是 Lun.AI AI 繪圖能讓我們一秒上太空、下一秒入魔界,但它有個難以言喻的痛: 「我無法讓我的主角,在第二張圖裡長得跟第一張一樣。」 「每次打指令總是要不到我們想要的樣子。」 這就是「AI 繪圖」的挑戰。 一切的開端,是 Google 昨天發表了一篇關於 Gemini
Thumbnail
2025/08/27
嗨,我是 Lun.AI AI 繪圖能讓我們一秒上太空、下一秒入魔界,但它有個難以言喻的痛: 「我無法讓我的主角,在第二張圖裡長得跟第一張一樣。」 「每次打指令總是要不到我們想要的樣子。」 這就是「AI 繪圖」的挑戰。 一切的開端,是 Google 昨天發表了一篇關於 Gemini
Thumbnail
2025/08/25
這是一份40頁的AI變現指南,幫助讀者將AI技術應用於事業發展,內容涵蓋市場趨勢分析、策略規劃、實務操作步驟及工具推薦,並提供三個獨特的AI應用領域:中小企業AI自動化顧問、提示工程即服務(PaaS)和客製化AI代理人(Agent)開發。
2025/08/25
這是一份40頁的AI變現指南,幫助讀者將AI技術應用於事業發展,內容涵蓋市場趨勢分析、策略規劃、實務操作步驟及工具推薦,並提供三個獨特的AI應用領域:中小企業AI自動化顧問、提示工程即服務(PaaS)和客製化AI代理人(Agent)開發。
2025/08/23
2025年AI產業變革,80%企業高管計劃增加新技術支出。本文剖析AI服務市場格局,提供14頁初步市場分析報告,涵蓋12種變現模式、2條最佳起步路徑,並針對方格子會員提供40頁完整指南,包含高階服務詳解、前沿技術商機、客戶獲取手冊及市場宏觀趨勢等,助你建立AI事業護城河。
2025/08/23
2025年AI產業變革,80%企業高管計劃增加新技術支出。本文剖析AI服務市場格局,提供14頁初步市場分析報告,涵蓋12種變現模式、2條最佳起步路徑,並針對方格子會員提供40頁完整指南,包含高階服務詳解、前沿技術商機、客戶獲取手冊及市場宏觀趨勢等,助你建立AI事業護城河。
看更多
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
一直以來都在用AI製圖製作文章示意圖,昨天寫了篇職場相關的文章,照慣例點開Leonardo.AI,突然想到最近看到的「魔法咒語」,就嘗試變形一下,想不到效果真的還不錯,超出我預期地達到我心中的構想,每次生成4張,總有幾張的表情真的有表現出「無奈」的感覺~也很符合我個人對「動物擬人」的審美偏好~
Thumbnail
一直以來都在用AI製圖製作文章示意圖,昨天寫了篇職場相關的文章,照慣例點開Leonardo.AI,突然想到最近看到的「魔法咒語」,就嘗試變形一下,想不到效果真的還不錯,超出我預期地達到我心中的構想,每次生成4張,總有幾張的表情真的有表現出「無奈」的感覺~也很符合我個人對「動物擬人」的審美偏好~
Thumbnail
用人工智慧編輯過世的狗狗 #微軟設計師
Thumbnail
用人工智慧編輯過世的狗狗 #微軟設計師
Thumbnail
最近AI社團留行青花瓷風,就跟風玩一下。 嗯~大叔也快萌化了。 給Bing AI的指令: 青花瓷可愛小花貓,穿著和服,抱著一個茶杯,表情恬靜幸福,坐在一個花圈裡,加入一些櫻花的細節,全彩色,高清,吉卜力工作室風格。
Thumbnail
最近AI社團留行青花瓷風,就跟風玩一下。 嗯~大叔也快萌化了。 給Bing AI的指令: 青花瓷可愛小花貓,穿著和服,抱著一個茶杯,表情恬靜幸福,坐在一個花圈裡,加入一些櫻花的細節,全彩色,高清,吉卜力工作室風格。
Thumbnail
這四張AI繪圖作品獻給我的麻吉愛美麗, 一位與我一樣愛貓愛畫畫的女生。
Thumbnail
這四張AI繪圖作品獻給我的麻吉愛美麗, 一位與我一樣愛貓愛畫畫的女生。
Thumbnail
今天魔法的重點就是要畫出蝸牛,但這個對Moonshot來說很困難。失敗非常多張,大概是20張才勉強有一張接近,不論是怎樣的風格指令通通嘗試,但這蝸牛殼就是沒有想像中的漂亮。還要再研究研究。
Thumbnail
今天魔法的重點就是要畫出蝸牛,但這個對Moonshot來說很困難。失敗非常多張,大概是20張才勉強有一張接近,不論是怎樣的風格指令通通嘗試,但這蝸牛殼就是沒有想像中的漂亮。還要再研究研究。
Thumbnail
Gemini之前我有測試照片文字辨示及辨識植物,我突發奇想是否可以幫我分析圖片的提示詞,方便我AI生圖參考,沒想到也可以,我使用Ai生圖的照片。 結果分析如下: 好的,以下是對圖片的分析: 圖片描述 圖片顯示兩隻卡通柴犬並排站立,頭戴寫有「HAPPY」字樣的帽子。這表明柴犬很開心,玩得很開心
Thumbnail
Gemini之前我有測試照片文字辨示及辨識植物,我突發奇想是否可以幫我分析圖片的提示詞,方便我AI生圖參考,沒想到也可以,我使用Ai生圖的照片。 結果分析如下: 好的,以下是對圖片的分析: 圖片描述 圖片顯示兩隻卡通柴犬並排站立,頭戴寫有「HAPPY」字樣的帽子。這表明柴犬很開心,玩得很開心
Thumbnail
這篇文章描述了一次使用DALL-E3 of ChatGPT來創作藝術圖的過程,並介紹了原始創意的來源和貓狗奔跑的趣味圖片的背景故事。作者藉由DALL-E3的智能功能成功繪製出了與原始圖片相似的作品,並分享了其中的趣味與心得。
Thumbnail
這篇文章描述了一次使用DALL-E3 of ChatGPT來創作藝術圖的過程,並介紹了原始創意的來源和貓狗奔跑的趣味圖片的背景故事。作者藉由DALL-E3的智能功能成功繪製出了與原始圖片相似的作品,並分享了其中的趣味與心得。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News