大家最近打開 Google Gemini,有沒有發現一個長得很像香蕉的奇怪選項?
別懷疑你的眼睛,這就是 Google 最新釋出、基於 Gemini 3 架構打造的圖像生成模型——Nano Banana Pro。雖然名字聽起來很惡搞(官方甚至直接用了🍌圖示),但它的實力絕對是目前業界天花板等級,特別是它加入了「思考模型 (Thinking Process)」與超強的「繁體中文渲染」能力。
身為工程師,當然要第一時間來實測一下。以下是手把手的啟用教學,讓你用幾秒鐘就能召喚出這個最強 AI 繪圖助理。準備工作
首先,你需要準備:
- 一個 Google 帳號。
- 確認已訂閱 Gemini Advanced(這是 Pro 功能,免費版只能用標準模式)。
🍌 Nano Banana Pro 快速啟用指南 (4 步驟)

這張圖是我直接請 Nano Banana Pro 畫出來的「自我介紹說明書」(沒錯,圖中的文字也是它自己生成的,完全沒有後製 PS!),我們就照著這四個步驟來操作:
Step 1:進入 Advanced 模式
前往 gemini.google.com。請看向左上角,確認你的 Logo 旁有一個「鑽石圖示」並顯示 Gemini Advanced。如果是普通版,請點擊切換。
Step 2:選擇正確的模型 (關鍵!)
這是最重要的一步。點擊對話框上方的模型選單,你會看到多個選項。請務必選擇帶有黃色香蕉圖示的 「Nano Banana Pro (Thinking)」。
- 注意:一定要選帶有
(Thinking)的版本,這代表它在畫圖前會進行邏輯推理,這是畫出正確手指與文字的關鍵。
Step 3:輸入指令並等待「思考」
在對話框輸入你的提示詞(Prompt)。
- 小撇步:你可以像圖片中一樣輸入
@Nano Banana Pro來強制喚醒它。 - 觀察重點:按下 Enter 後,你會發現進度條顯示 「思考中 (Thinking...)」。這時候 AI 正在分析你的語意邏輯(例如:確認工程師喝咖啡的手勢是否符合人體工學),這比舊版直接算圖多花約 5~10 秒,但非常值得。

Step 4:獲得高品質成品
稍等片刻,一張電影級光影、細節滿點的圖片就會出現。就像教學圖中的示範:連螢幕上的程式碼、耳機的細節都能完美呈現。
💡 實測心得:為什麼工程師該用它?
經過這幾天的惡操(誤),整理出幾個 Nano Banana Pro 輾壓其他 AI 的特點:
- 它看得懂中文,也寫得出中文: 以前叫 AI 畫圖,上面的招牌字通常是亂碼。現在你可以直接下指令:「畫一個工程師拿著寫有『修不完』三個字的馬克杯」,它真的能寫出正確的繁體中文!這對於做梗圖、做海報簡直是神技。
- 邏輯不再崩壞: 多虧了那個「思考 (Thinking)」過程,它極少出現「三隻手」或「鍵盤跟桌子融為一體」這種低級錯誤。
- 角色連貫性: 你可以在對話中上傳一張生成的圖片,跟它說:「記住這個人的長相,下一張圖我要他趴在地上哭」,它能完美保留角色的臉部特徵,非常適合用來畫部落格的連載插圖。
📝 總結
雖然名字叫 Nano Banana 讓人有點想笑,但 Google 這次端出的牛肉確實很香。如果你跟我一樣是需要經營自媒體、或是需要快速產出高品質素材的工程師,強烈建議去試玩看看。
下一步挑戰: 下次我們來實測它的「多圖融合」功能,看看能不能把我們辦公室的實景照,一鍵轉成 Cyberpunk 風格的機房!















