Nano Banana 實測：強大的影像生成與編輯工具，角色一致性與其限制

每每看到Banana，除了想到小小兵，就是那句：你不是大俠，吃香蕉！

什麼是 Nano Banana？

Nano Banana是「Gemini 2.5 Flash Image」的暱稱，具備原生多模態的文字+圖片輸入輸出與強化的影像合成功能。支援影像生成、融合與精準局部編輯，並可用自然語言做針對性變更（如去除人物、改姿勢、上色、背景虛化等）。

它強調角色/人物「一致性」，可把同一角色放到不同情境，或依品牌模板批量產出一致風格素材。

前一陣子很紅的，用人物圖片產出公仔模型圖，就是用Nano Banana產出的。另外像是餵入一張食物的圖片，敘述他經過一段時間後的樣貌，最後產出了一張發霉的圖片，也是令人印象深刻的玩法。

實驗實驗實驗看看

測試所謂角色一致性能做到什麼地步，提示字如下：

女孩站在法國尼斯海邊沙灘上，對著捲起的浪潮潑水嬉戲，表情開心，穿著紅白相間的比基尼泳裝

聚焦在角色上半身，女孩微笑，85mm lens, f/1.4 aperture, bokeh, portrait shot

感覺還是滿厲害的，角色的頭髮質地以及臉部繃帶特徵都是一致的。就是第一次的產圖人物在畫面佔比太少，嘗試用一些鏡頭提示字調整時，模型只是放大，看起來也沒有重繪。

試試換服裝、換背景、拿線條人引導

將衣服換成黑色禮服

將衣服換成軍裝

背景改成烈日的沙漠中

(上傳線條人圖片)手勢換成這樣，一手比槍，一手張開

整體來說是滿有趣的，換裝就真的只是換裝，人物臉部都維持與原圖一致。不過始終有感覺到一股強烈的「P圖」感，尤其是換背景時，人物光影皆不變，感覺又更違和一點。

用線條人引導滿有趣的，算是成本很低的編輯方式，雖然手指頭多一根的這種老問題還是會發生。

如果想要讓弗洛洛幫我賣沙發呢？

(上傳沙發圖)女孩橫躺在沙發上，頭靠在扶手上，看家具雜誌看到睡著，雜誌攤開蓋在臉上。右手垂到沙發外。女孩身穿白色的連身洋裝，短裙長，露出腿，左腿歪曲立在沙發上。洋裝上有黑色的蕾絲點綴。

頭靠在左邊靠近燈飾的扶手上，腳在右邊，左腳彎曲立在沙發上，右手垂到地上

頭靠在左邊靠近燈飾的扶手上，腳在右邊，左腳彎曲立在沙發上，右手垂到地上。身穿白色素色短T，牛仔短褲

沙發圖是從ikea網站找來測試的。原本嘛，是料想要人物躺在左邊的扶手上，但他給了我一張很奇耙的合成圖。嘗試用更明確的敘述引導他，然而他還是不幫我重繪。接著嘗試改變更多述敘(改變衣著)，希望模型能整張圖重新繪製，但還是不如預期。

只能說賣沙發或許先等等。

用線條人做大幅度圖片的改動引導

(上傳線條人)生成圖片：左邊是這位女士，拿鞭子攻擊右方；右邊是穿著銀色盔甲的女士，拿盔甲防守

線條人可愛吧（摀臉)。能看出產出的圖跟原圖長得不同。看得出模型的邏輯是分析原圖的角色構成元素，並在利用線條人繪製圖片時，將角色元素帶入產圖。此外風格也無法與原圖相同。

單玩線條人也很有趣

這是一個打鬥畫面，女孩站在左邊拿著鞭子攻擊，右邊是新增的女孩，拿盾牌防禦，通體是白銀色的輕量盔甲，不妨礙行動，手拿白銀色的盾牌，盔甲是由西方龍的元素組成，下擺是裙子，頭髮是金黃色長髮，在戰鬥中飄逸。產生兩種風格給我，一種偏向漫畫，一種偏向寫實。

這一part就是一般的產圖。漫畫風格因為我沒有清楚指定，就變成美式漫畫風了。寫實風格的圖頗有電影劇照的感覺，滿好看的。

我感覺嘛

我主觀感覺上面的實驗可以看出模型本身有幾種執行方針：

不影響構圖的狀況下，會只編輯要改變的部分，像是服裝、背景、人體局部姿勢。所謂人物一致性，因為沒改到圖當然就長一樣。
構圖不同就會整個重繪，產出的內容若要夠與想像相符，就越需要更精準的述敘提示。
測試期間我被拒絕很多次，像是：「目前，我還無法將多個元素整合到一個圖像中，也無法編輯您上傳的圖像。」還有別的運作邏輯我沒搞清楚。

另外讓我感受到的優點是，他產圖飛快、神快。在做測試或是把玩都不需要等待太久。每日可以使用的免費token量也足夠大家好好玩玩。給個大拇哥！

什麼是 Nano Banana？

實驗實驗 實驗看看

我感覺嘛

實驗實驗實驗看看