每每看到Banana,除了想到小小兵,就是那句:你不是大俠,吃香蕉!

什麼是 Nano Banana?
Nano Banana是「Gemini 2.5 Flash Image」的暱稱,具備原生多模態的文字+圖片輸入輸出與強化的影像合成功能。支援影像生成、融合與精準局部編輯,並可用自然語言做針對性變更(如去除人物、改姿勢、上色、背景虛化等)。
它強調角色/人物「一致性」,可把同一角色放到不同情境,或依品牌模板批量產出一致風格素材。
前一陣子很紅的,用人物圖片產出公仔模型圖,就是用Nano Banana產出的。另外像是餵入一張食物的圖片,敘述他經過一段時間後的樣貌,最後產出了一張發霉的圖片,也是令人印象深刻的玩法。
實驗實驗 實驗看看
- 測試所謂角色一致性能做到什麼地步,提示字如下:
女孩站在法國尼斯海邊沙灘上,對著捲起的浪潮潑水嬉戲,表情開心,穿著紅白相間的比基尼泳裝
聚焦在角色上半身,女孩微笑,85mm lens, f/1.4 aperture, bokeh, portrait shot
感覺還是滿厲害的,角色的頭髮質地以及臉部繃帶特徵都是一致的。就是第一次的產圖人物在畫面佔比太少,嘗試用一些鏡頭提示字調整時,模型只是放大,看起來也沒有重繪。
- 試試換服裝、換背景、拿線條人引導
將衣服換成黑色禮服
將衣服換成軍裝
背景改成烈日的沙漠中
(上傳線條人圖片)手勢換成這樣,一手比槍,一手張開
整體來說是滿有趣的,換裝就真的只是換裝,人物臉部都維持與原圖一致。不過始終有感覺到一股強烈的「P圖」感,尤其是換背景時,人物光影皆不變,感覺又更違和一點。
用線條人引導滿有趣的,算是成本很低的編輯方式,雖然手指頭多一根的這種老問題還是會發生。
- 如果想要讓弗洛洛幫我賣沙發呢?
(上傳沙發圖)女孩橫躺在沙發上,頭靠在扶手上,看家具雜誌看到睡著,雜誌攤開蓋在臉上。右手垂到沙發外。女孩身穿白色的連身洋裝,短裙長,露出腿,左腿歪曲立在沙發上。洋裝上有黑色的蕾絲點綴。
頭靠在左邊靠近燈飾的扶手上,腳在右邊,左腳彎曲立在沙發上,右手垂到地上
頭靠在左邊靠近燈飾的扶手上,腳在右邊,左腳彎曲立在沙發上,右手垂到地上。身穿白色素色短T,牛仔短褲
沙發圖是從ikea網站找來測試的。原本嘛,是料想要人物躺在左邊的扶手上,但他給了我一張很奇耙的合成圖。嘗試用更明確的敘述引導他,然而他還是不幫我重繪。接著嘗試改變更多述敘(改變衣著),希望模型能整張圖重新繪製,但還是不如預期。
只能說賣沙發或許先等等。
- 用線條人做大幅度圖片的改動引導
(上傳線條人)生成圖片:左邊是這位女士,拿鞭子攻擊右方;右邊是穿著銀色盔甲的女士,拿盔甲防守
線條人可愛吧(摀臉)。能看出產出的圖跟原圖長得不同。看得出模型的邏輯是分析原圖的角色構成元素,並在利用線條人繪製圖片時,將角色元素帶入產圖。此外風格也無法與原圖相同。
- 單玩線條人也很有趣
這是一個打鬥畫面,女孩站在左邊拿著鞭子攻擊,右邊是新增的女孩,拿盾牌防禦,通體是白銀色的輕量盔甲,不妨礙行動,手拿白銀色的盾牌,盔甲是由西方龍的元素組成,下擺是裙子,頭髮是金黃色長髮,在戰鬥中飄逸。產生兩種風格給我,一種偏向漫畫,一種偏向寫實。
這一part就是一般的產圖。漫畫風格因為我沒有清楚指定,就變成美式漫畫風了。寫實風格的圖頗有電影劇照的感覺,滿好看的。
我感覺嘛
我主觀感覺上面的實驗可以看出模型本身有幾種執行方針:
- 不影響構圖的狀況下,會只編輯要改變的部分,像是服裝、背景、人體局部姿勢。所謂人物一致性,因為沒改到圖當然就長一樣。
- 構圖不同就會整個重繪,產出的內容若要夠與想像相符,就越需要更精準的述敘提示。
- 測試期間我被拒絕很多次,像是:「目前,我還無法將多個元素整合到一個圖像中,也無法編輯您上傳的圖像。」還有別的運作邏輯我沒搞清楚。
另外讓我感受到的優點是,他產圖飛快、神快。在做測試或是把玩都不需要等待太久。每日可以使用的免費token量也足夠大家好好玩玩。給個大拇哥!