Nano Banana 實測:強大的影像生成與編輯工具,角色一致性與其限制

更新 發佈閱讀 5 分鐘
每每看到Banana,除了想到小小兵,就是那句:你不是大俠,吃香蕉!
raw-image

什麼是 Nano Banana?

Nano Banana是「Gemini 2.5 Flash Image」的暱稱,具備原生多模態的文字+圖片輸入輸出與強化的影像合成功能。支援影像生成、融合與精準局部編輯,並可用自然語言做針對性變更(如去除人物、改姿勢、上色、背景虛化等)。

它強調角色/人物「一致性」,可把同一角色放到不同情境,或依品牌模板批量產出一致風格素材。

前一陣子很紅的,用人物圖片產出公仔模型圖,就是用Nano Banana產出的。另外像是餵入一張食物的圖片,敘述他經過一段時間後的樣貌,最後產出了一張發霉的圖片,也是令人印象深刻的玩法。

實驗實驗 實驗看看

  • 測試所謂角色一致性能做到什麼地步,提示字如下:
女孩站在法國尼斯海邊沙灘上,對著捲起的浪潮潑水嬉戲,表情開心,穿著紅白相間的比基尼泳裝

聚焦在角色上半身,女孩微笑,85mm lens, f/1.4 aperture, bokeh, portrait shot

感覺還是滿厲害的,角色的頭髮質地以及臉部繃帶特徵都是一致的。就是第一次的產圖人物在畫面佔比太少,嘗試用一些鏡頭提示字調整時,模型只是放大,看起來也沒有重繪。

  • 試試換服裝、換背景、拿線條人引導
將衣服換成黑色禮服

將衣服換成軍裝

背景改成烈日的沙漠中

(上傳線條人圖片)手勢換成這樣,一手比槍,一手張開​

整體來說是滿有趣的,換裝就真的只是換裝,人物臉部都維持與原圖一致。不過始終有感覺到一股強烈的「P圖」感,尤其是換背景時,人物光影皆不變,感覺又更違和一點。

用線條人引導滿有趣的,算是成本很低的編輯方式,雖然手指頭多一根的這種老問題還是會發生。

  • 如果想要讓弗洛洛幫我賣沙發呢?
(上傳沙發圖)女孩橫躺在沙發上,頭靠在扶手上,看家具雜誌看到睡著,雜誌攤開蓋在臉上。右手垂到沙發外。女孩身穿白色的連身洋裝,短裙長,露出腿,左腿歪曲立在沙發上。洋裝上有黑色的蕾絲點綴。

頭靠在左邊靠近燈飾的扶手上,腳在右邊,左腳彎曲立在沙發上,右手垂到地上

頭靠在左邊靠近燈飾的扶手上,腳在右邊,左腳彎曲立在沙發上,右手垂到地上。身穿白色素色短T,牛仔短褲

沙發圖是從ikea網站找來測試的。原本嘛,是料想要人物躺在左邊的扶手上,但他給了我一張很奇耙的合成圖。嘗試用更明確的敘述引導他,然而他還是不幫我重繪。接著嘗試改變更多述敘(改變衣著),希望模型能整張圖重新繪製,但還是不如預期。

只能說賣沙發或許先等等。

  • 用線條人做大幅度圖片的改動引導
(上傳線條人)生成圖片:左邊是這位女士,拿鞭子攻擊右方;右邊是穿著銀色盔甲的女士,拿盔甲防守

線條人可愛吧(摀臉)。能看出產出的圖跟原圖長得不同。看得出模型的邏輯是分析原圖的角色構成元素,並在利用線條人繪製圖片時,將角色元素帶入產圖。此外風格也無法與原圖相同。

  • 單玩線條人也很有趣
這是一個打鬥畫面,女孩站在左邊拿著鞭子攻擊,右邊是新增的女孩,拿盾牌防禦,通體是白銀色的輕量盔甲,不妨礙行動,手拿白銀色的盾牌,盔甲是由西方龍的元素組成,下擺是裙子,頭髮是金黃色長髮,在戰鬥中飄逸。產生兩種風格給我,一種偏向漫畫,一種偏向寫實。

這一part就是一般的產圖。漫畫風格因為我沒有清楚指定,就變成美式漫畫風了。寫實風格的圖頗有電影劇照的感覺,滿好看的。

我感覺嘛

我主觀感覺上面的實驗可以看出模型本身有幾種執行方針:

  • 不影響構圖的狀況下,會只編輯要改變的部分,像是服裝、背景、人體局部姿勢。所謂人物一致性,因為沒改到圖當然就長一樣。
  • 構圖不同就會整個重繪,產出的內容若要夠與想像相符,就越需要更精準的述敘提示。
  • 測試期間我被拒絕很多次,像是:「目前,我還無法將多個元素整合到一個圖像中,也無法編輯您上傳的圖像。」還有別的運作邏輯我沒搞清楚。

另外讓我感受到的優點是,他產圖飛快、神快。在做測試或是把玩都不需要等待太久。每日可以使用的免費token量也足夠大家好好玩玩。給個大拇哥!

留言
avatar-img
留言分享你的想法!
avatar-img
洛伊東東-咚咚咚
1會員
16內容數
稍微鼓起勇氣離職後, 開始認真面對人生,試著找尋這輩子想做的事, 希望不要太快擔心活不下去XD
洛伊東東-咚咚咚的其他內容
2025/07/25
...然後今天在使用時,卻不斷碰到問題。 常常是給出指令後,先是回應Failed to generate an LLM response. 接著刷了一排的Rovo Dev Agents is not installed on your site
Thumbnail
2025/07/25
...然後今天在使用時,卻不斷碰到問題。 常常是給出指令後,先是回應Failed to generate an LLM response. 接著刷了一排的Rovo Dev Agents is not installed on your site
Thumbnail
2025/07/19
Atlassian公司將每日免費Token限額由2000萬調整為500萬,文章探討此變動的影響及因應之道,並提供節省Token的技巧。
Thumbnail
2025/07/19
Atlassian公司將每日免費Token限額由2000萬調整為500萬,文章探討此變動的影響及因應之道,並提供節省Token的技巧。
Thumbnail
2025/07/16
這篇文章提供使用ComfyUI生成圖片的步驟教學,從模型下載、參數設定到執行,並說明可能遇到的問題及解決方案。文中也介紹Flux模型的特色,例如:多種衍生模型、強大的自然語言理解能力以及可套用的社群工作流。
Thumbnail
2025/07/16
這篇文章提供使用ComfyUI生成圖片的步驟教學,從模型下載、參數設定到執行,並說明可能遇到的問題及解決方案。文中也介紹Flux模型的特色,例如:多種衍生模型、強大的自然語言理解能力以及可套用的社群工作流。
Thumbnail
看更多