Google AI 圖像新模型 nano-banana:人物一致性升級,精準生成換裝公仔

更新於 發佈於 閱讀時間約 6 分鐘


🍌 Nano-banana 是什麼?

Google 最新推出的圖片生成模型 Gemini 2.5 Flash Image Preview(代號「nano-banana」)。這是全新的多模態圖像模型,結合文字理解、影像生成,全面提升創作效率!

📌 Nano-banana 功能特性

  • 📝 文字驅動影像生成與編輯:一句簡單的文字指令,就能替換背景、改變色調、調整姿勢或添加元素,操作直覺又靈活。
  • 🌆 多影像融合:能同時理解多張圖片,將它們融合成全新作品。例如:把角色置入不同場景、將產品放進新設計版面。
  • 👩‍💻 角色與對象一致性:角色或物件的外觀能保持一致,特別適合品牌素材、漫畫角色或遊戲人物創作。

Gemini 2.5 Flash Image 使用自然語言進行有針對性的轉換,所有生成影像都會自動加入 SynthID 隱形浮水印,確保 AI 內容透明且可追溯


🧚 如何開始使用 Nano-banana?

該模型現已可以透過 Gemini Google AI StudioVertex AI 來使用它。
以下提供三種使用方法,選擇最適合你的即可。

方法一:Gemini App

使用手機安裝 Gemini App 👉 Google Play 下載連結App Store 下載連結
然後在對話框開啟「🍌圖像」後送出提示詞,能直接在手機上生成圖像。

Gemini App 開啟圖像功能

Gemini App 開啟圖像功能

方法二:Gemini 網頁版

由此前往👉 https://gemini.google.com/app?hl=zh-TW
打開「圖像」選項,上傳圖片後送出提示詞即可。

Gemini 網頁版

Gemini 網頁版


方法三:Google AI Studio

Google AI Studio 是 Google 推出的雲端平台,專門用來測試、體驗和使用 Gemini 系列 AI 模型,可以生成範例程式碼或 API KEY,通常是給開發者使用

1️⃣ 打開 Google AI Studio
由此前往👉 https://aistudio.google.com/prompts/new_chat

2️⃣ 選擇模型

在介面右側切換模型中找到 Gemini 2.5 Flash Image Preview(代號「nano-banana」),接著在中間輸入框送出提示詞即可。

Google AI Studio 介面

Google AI Studio 介面


👩‍💻 實際示範三款創作

(以下以 Google AI Studio 介面示範)

👗 角色換裝要求

首先上傳兩張照片,一張是角色,一張是穿搭單品平面圖,請 AI 將角色換上裝扮。

Google AI Studio 圖像指令

Google AI Studio 圖像指令


成果照:👩‍💻 真的超準確的耶,服裝單品都跟提供的一模一樣!

Gemini 2.5 Flash Image Preview 成果照

Gemini 2.5 Flash Image Preview 成果照


接著可以請它做其他動作,就很像網拍模特兒擺動作,例如:一手抓帽子,側身動作,ˋ正面微笑等指令,也能準確更換。

完整結果圖:(這套衣服哪裡有賣啊😍,超想買的!)

Nano-banana 成果照

Nano-banana 成果照

🧍‍♀️ 角色公仔要求

接下來是網路近期最熱門的公仔轉換,例如:將這張女孩圖片轉換為擬真的收藏模型展示照,(後面補上環境細節),轉換後完全一模一樣呢🤩。

手辦公仔轉換

手辦公仔轉換

以下提供兩個不同場景的公仔指令提示詞,你可以自己玩玩看喔!
公仔指令1:
把圖片轉換成一張擬真的收藏模型展示照。前方是精緻立體模型,後方是一張印有角色原始插畫與英文標題的照片卡,形成模型與插畫並列的構圖。保留展示櫃背景,整體呈現專業產品攝影風格。

公仔指令2:
生成高畫質場景:將圖片主體轉換為一個1/7比例的PVC公仔,站在透明圓形底座上,擺放於蘋果電腦桌前。螢幕顯示該角色的3D線框專業系統設計圖。公仔造型真實、清晰。桌上有鍵盤、滑鼠,以及同款日系風格的商品包裝盒。

🕺 角色構圖要求

在網路上看過其他網友測試可以將兩個角色要求成火柴人構圖,於是梨編也弄了兩個角色加上一張火柴人動作指導。

成果圖:兩個角色在打架,加上火柴人構圖要求也能準確生成動作!
(雖然有一點點不一樣,就要多生成幾次去調整才行喔。)

Nano-banana 構圖要求

Nano-banana 構圖要求



👩‍💻 使用心得

用下來真的超驚艷,生成速度也很快。雖然角色如果是『真人』的話,仔細看還是會有些小差異,但服裝和周邊道具的還原度超高。在『動漫人物』的表現上尤其出色。偶爾有幾次生成失敗,但只要稍微調整提示詞,就能得到想要的效果。整體玩下來真的挺上癮的 🔥,這次更新感受很明顯!


🔗📌 想了解更多使用案例或 AI 工具,歡迎關注 @RIN 數位研究室 👩‍💻
梨編會持續實測有用的 App & AI 應用,用最省時的方式陪你走進未來 ✨
🔎 本文內容以撰寫當下的工具與版本為主,未來若有更新,功能可能略有不同。如有錯誤或補充,歡迎留言協助修正,我會持續更新!

📖 參考文章



留言
avatar-img
留言分享你的想法!
avatar-img
App Lab 數位研究室
41會員
32內容數
嗨!I'm Rin 梨子,喜好研究各種數位科技,同時又愛好看劇、偶爾看看書,這裡會不定期分享實用的數位工具與資訊、溫暖且動人的作品與各種生活新知(如果有的話)。
2025/08/23
2025.0823 前言 這個週末打開 Gemini 突然發現有免費試用 Veo 3 AI 影片體驗,原本要訂閱 Google AI Pro 方案才有的功能耶!免費可生成三次影片,就來試玩看看吧! 近年來,AI 從文字生成、圖像生成一路進化到影片生成,而 Google 在 Google I
Thumbnail
2025/08/23
2025.0823 前言 這個週末打開 Gemini 突然發現有免費試用 Veo 3 AI 影片體驗,原本要訂閱 Google AI Pro 方案才有的功能耶!免費可生成三次影片,就來試玩看看吧! 近年來,AI 從文字生成、圖像生成一路進化到影片生成,而 Google 在 Google I
Thumbnail
2025/08/01
20250801 前言: 其實之前在介紹 2025 新進聊天機器人時就有想過介紹 Elon Musk 的 xAI 出的 Grok ,只不過那時候試玩時覺得跟 ChatGPT 沒什麼兩樣,倒是有一些獨特的幽默感?不過隨著時間已經慢慢推出更多好用的功能!最近聲名大噪的 Ani 再一次提升了 Grok的知
Thumbnail
2025/08/01
20250801 前言: 其實之前在介紹 2025 新進聊天機器人時就有想過介紹 Elon Musk 的 xAI 出的 Grok ,只不過那時候試玩時覺得跟 ChatGPT 沒什麼兩樣,倒是有一些獨特的幽默感?不過隨著時間已經慢慢推出更多好用的功能!最近聲名大噪的 Ani 再一次提升了 Grok的知
Thumbnail
2025/07/17
目前免費預覽中,想體驗未來式開發,不妨試試。 🚀 Kiro 是什麼?Amazon 推出的 AI IDE,打造從原型到生產的開發流程新體驗! 還在用 Vibe Coding 開發專案?如果你追求的不只是寫程式,而是更專業、更結構化的開發流程,那你可能會愛上 Kiro 。
Thumbnail
2025/07/17
目前免費預覽中,想體驗未來式開發,不妨試試。 🚀 Kiro 是什麼?Amazon 推出的 AI IDE,打造從原型到生產的開發流程新體驗! 還在用 Vibe Coding 開發專案?如果你追求的不只是寫程式,而是更專業、更結構化的開發流程,那你可能會愛上 Kiro 。
Thumbnail
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News