AI|500 張圖後,我學會和香蕉「對話」:Nano Banana 分鏡實驗記

更新 發佈閱讀 7 分鐘
raw-image

最近大家應該常常在社群看到那種「Nano Banana 生出公仔+包裝盒+背景是 3D 軟體介面」的示照片吧?說真的,看久了有點審美疲勞。我心裡反而在想:

這條香蕉,能不能幫我生出一系列有劇情的分鏡?

自從前一篇文章「AI|一次十張、再十張!我把 Nano Banana 畫漫畫的極限榨乾了」發佈後,我就一直在想,如果可以一次生成多張圖片,那用來做分鏡不就剛好嗎?

我的想法是這樣:如果它能一次生成連續的關鍵影格(Keyframe)當首尾圖,丟去生成多支短片,再接成一支完整影片的可能性就大了。於是我開始實測,三天、用三個帳號、超過 500 多張圖片,最後才找到比較穩定的做法。

過程很不輕鬆——我花了三天、三個帳號,生了超過 500 張圖,才慢慢找到讓它「乖乖合作」的方式。這篇文章就記錄我一路上的嘗試與心得,也許能幫到想用它來講故事的人。


備好參考圖片

Nano Banana 的一大特色是 多模態能力,也就是文字+圖片一起輸入。

  • 最常見:上傳一張圖片,用提示詞修改。這部分大家應該都玩過,我就不贅述。
  • 多圖融合:例如上傳兩個角色+一個道具,然後加上劇情描述,讓它幫我「排成一個畫面」。
  • 所有上傳的參考圖片比例要一致,否則它會抓「最後一張上傳」的當作生成的比例。
  • 角色表(Character Sheet)先準備好:最好先用一個站姿正面生成角色的不同姿勢、表情、角度,再用來合成在一個畫面中才會自然。
三張白色背景圖片搭配提示詞,生成兩張高度一致性的圖片

三張白色背景圖片搭配提示詞,生成兩張高度一致性的圖片


完整而具體的描述

很多人卡住的點,就是提示詞寫得太「單薄」。要記住:你的提示詞就是一份給 Banana 的簡報

  • 完整句子比單字好
    舉例:「一隻咖啡色的金吉拉兔,在陽光灑落的草地上大步跳躍,背景是模糊的草叢。
    就比「一隻兔子在草地上」準確太多。
  • 尺寸要明確
    別說「小風鈴」,要寫「不超過手掌一半大小的風鈴」。
  • 動作細節要精確
    「用指尖捏著掛繩最上端」會比「拿著風鈴」更貼近你的想要。

所以,這次實驗最大的體會是:

成功的 Nano Banana 提示詞,不是詞彙堆砌,而是要提供一個故事或完整的視覺藍圖。 你描述得越完整,它就越能理解並實現你腦中的想法。
左邊:詳細描述「用指尖捏著風鈴上的吊繩頂端」|右邊:只寫「拿風鈴」

左邊:詳細描述「用指尖捏著風鈴上的吊繩頂端」|右邊:只寫「拿風鈴」

花點時間詳細描述(而且正確),也能讓動作精確到這種程度

花點時間詳細描述(而且正確),也能讓動作精確到這種程度


運用攝影與藝術術語

不要忘了這條香蕉是學富五車:什麼領域的專業術語它都背起來了。

  • 鏡頭與構圖:close-up(特寫)、wide-angle shot(廣角)、low-angle shot(低角度)⋯⋯等等的,儘管吩咐它。
  • 光線與氛圍:soft natural light(柔和自然光)、backlit(逆光)、studio lighting(棚燈)⋯⋯等等的都能幫你定義場景氣氛。
  • 藝術風格:Pop Art、Surrealism、Rococo、Baroque……,如果你說不出口,就找一張你想要的風格圖片,丟給任何一個 AI,它會告訴你這什麼風格。

換句話說,如果你懂一點攝影或繪畫術語,就能把 Banana 當一位攝影師、設計師或畫家來溝通。不懂也沒關係,就是功課做一下,找幾張圖片先給它看,它會告訴你這是什麼鏡頭、如何佈光、是什麼藝術風格。


迭代與對話式編輯

不要期待一次到位,你和 Nano Banana 的合作根本就是像和夥伴那樣用「聊的」。

  • 逐步修改:先看它丟出的版本,你再說「背景亮一點」「旁邊加一隻鳥」。這樣它會慢慢貼近你的想法。
  • 山不轉路轉:如果一組兩張的運鏡感圖片老是卡住,就先出一張,再用提示詞讓它「運鏡」
  • 自然語言比 JSON 靠譜:我試過用 JSON 控制連續生成,但 Banana 常常搞混,甚至當成 meta 指令。反而是用自然語言的完整英文句子最有效。
  • 不要自相矛盾:如果一直失敗,你也搞不清楚原因在哪,那麼有90%的可能就是「提示詞中有互相矛盾」。例如寫「廣角視野」卻又指定「焦距 50mm」,這就兜不起來。如果你自己找不到原因,就直接問它:「幫我檢查提示詞有沒有衝突。」這個意外地好用。

簡而言之,這過程很像導演排戲:一遍一遍修,最後才會得到理想版本


一次多張的提示詞結構怎麼寫

要讓 Nano Banana 乖乖在一次對話中就把多張圖生出來,提示詞的結構上可以分成:

全域宣告:這一段用來描述全部圖片都用得到的,例如圖片風格、光線、氛圍等,還要跟它說「接下來每一段提示詞要獨立生成一張圖片,不要將圖片合併在一張」。
第一張輸出(第一張影格 –構圖主題描述):詳細描述圖片中的細節,如果你上傳了2個以上角色或道具圖片,就用「圖片檔名」來告訴 Nano Banana 「圖片檔名是誰」,這樣不僅可以幫你自己在寫提示詞時,分辨有沒有描述錯對象,對 Nano Banana來說,也不會混淆。
攝影機設定:在這裡描述鏡頭焦距、運鏡、光圈或快門等。
第 X 張輸出(第X張影格 –構圖主題描述):依據第一張的寫法仔細描述。其他依此類推。
攝影機設定:如前一段,描述這一張的攝影機參數。依此類推。‘
禁止事項(就是 AI 生圖平台常見的「負面提示詞」):例如不要在畫面中出現文字、不要有人、不要有⋯⋯等等。
如果不在一開頭就跟它說「勿將多個場景合併為拼貼畫或分割畫面」,就會生出這樣的切割組合畫面

如果不在一開頭就跟它說「勿將多個場景合併為拼貼畫或分割畫面」,就會生出這樣的切割組合畫面

簡而言之,這個結構和 HTML 等等的很像,不同之處就是用人類看得懂的自然語言說給它聽就行。


其他小發現

  • 避開尖峰時段:晚上七點到十一點左右,特別容易罷工或亂丟東西應付你。
  • 少量生成最穩:一次要求三到四張,成功率最高。
  • 生成英文字最準:如果圖片中要有中文、日文,就常常出錯,尤其是漢字+假名。
  • AI 需要你:你要不斷補細節,否則它很容易「自由發揮」到失控。
尖峰時刻就裝傻停擺(明明剛剛才生成好幾張)

尖峰時刻就裝傻停擺(明明剛剛才生成好幾張)


提示詞不是咒語,而是分鏡指引

這三天的實測讓我更確信:

Nano Banana 不會因為你丟了幾個詞就變魔法師。它更像是一個合作者,需要你提供完整的故事結構和細節,才能幫你拼出腦中的畫面。

所以,與其把提示詞當咒語,不如把它當成「講故事的劇本」——

只要你描述得夠清楚,它就能幫你完成一張張連續的分鏡,甚至是一整段短片。

留言
avatar-img
Thomas的沙龍
10會員
7內容數
在這裡,我用故事寫 AI,也用影像、文字和物件回望日常。記下一支筆的手感、一張照片的光線、一段創作過程的起伏;也記錄生活裡那些微小但有溫度的東西。每篇文章都是一次對話——關於創作、關於觀察、也關於我如何在快速變動的世界裡,找到屬於自己的節奏與光亮。
Thomas的沙龍的其他內容
2025/09/04
實測Gemini Nano Banana AI繪圖工具,一次生成十張漫畫圖的挑戰!比較Google AI Studio和Gemini Pro版,評比其穩定性、聽從指令程度以及畫面品質差異,並分享心得與Notion整理頁面連結。
Thumbnail
2025/09/04
實測Gemini Nano Banana AI繪圖工具,一次生成十張漫畫圖的挑戰!比較Google AI Studio和Gemini Pro版,評比其穩定性、聽從指令程度以及畫面品質差異,並分享心得與Notion整理頁面連結。
Thumbnail
2025/08/31
深入探討 Google Gemini 2.5 Flash Image (Nano Banana) 的強大功能,包含圖像生成、編輯、合成,以及令人驚豔的角色一致性。與 Qwen 3 對比實測,並分享提升使用效率的小技巧。
Thumbnail
2025/08/31
深入探討 Google Gemini 2.5 Flash Image (Nano Banana) 的強大功能,包含圖像生成、編輯、合成,以及令人驚豔的角色一致性。與 Qwen 3 對比實測,並分享提升使用效率的小技巧。
Thumbnail
2025/08/29
說到臺南運河,上一篇文章才剛提到它即將滿百歲,這回就順著這條水路,把我多年前製作的一張「1930年代臺南運河盲段 3D情境模擬圖」重新翻出來。這個「盲段」位置大約就在今天的河樂廣場後半段,靠近運河那一端。趁著腦袋裡的記憶還沒退潮,就來寫一下那段製作過程的點滴。
Thumbnail
2025/08/29
說到臺南運河,上一篇文章才剛提到它即將滿百歲,這回就順著這條水路,把我多年前製作的一張「1930年代臺南運河盲段 3D情境模擬圖」重新翻出來。這個「盲段」位置大約就在今天的河樂廣場後半段,靠近運河那一端。趁著腦袋裡的記憶還沒退潮,就來寫一下那段製作過程的點滴。
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
Thumbnail
這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News