使用 Google AI Studio 讓衣服被模特兒穿上

更新於 發佈於 閱讀時間約 3 分鐘

前言

大家好~~~我是維那思,之前聽了科技浪Podcast EP81介紹Gemini 2.0 Flash Exp.這個最新模型,好像很厲害而且覺得很有趣,這兩天好不容易有時間,所以來玩玩看並跟大家分享。

Google AI Studio 是一個強大平台,允許用戶使用先進的 AI 技術來生成、編輯和增強圖像、視頻等多媒體內容,提供創新且直觀的創作體驗。平台內上線了最新模型Gemini 2.0 Flash Exp.Gemini 支持多種輸入格式,包括文字、圖像、視頻和音頻,允許用戶以多種方式與模型交互,以2025.03.27測試當下,是目前有釋出的模型中暫時領先的,重點目前測試中是免費。

原本我是想要讓自己當Model穿上網路上想穿的衣服的,但效果好像有點差,衣服的LOGO或花樣會變形,不然就是保持衣服的樣子,但人會怪怪的;猜想可能是給與兩張圖片(Model與衣服),或許對於Google AI Studio來說參數有點多,會錯亂或者產生幻覺。

raw-image
分別傳Model跟衣服的結果,衣服的字不容易維持。

後來改成讓Google AI Studio自己去產製虛擬Model,透過固定衣服這個變數,發現效果好很多,目前測試結果,圖片固定一張,看要固定人或者固定衣服,效果會比較好。這個測試示範怎麼很快創造一些服裝展示或換裝效果。以下是我使用 Google AI Studio 的步驟供大家參考:

步驟 1:準備圖片

選擇衣服圖片:選擇一張想套用的衣服圖片,圖片應該是單獨的服裝圖片,以下兩張圖片是我用來測試的資料,故意找一張有文字跟一張花紋特別的圖片,感覺比較難,也容易測出效果。

raw-image
raw-image


步驟 2:使用 Google AI Studio

登入 Google AI Studio:前往 Google AI Studio 官網,登入你的 Google 帳戶。

點選產生新的Prompt

raw-image

選擇 Gemini 2 Flash 模型:在工具中選擇「Gemini 2 Flash」模型,這是用於圖片生成和編輯的實驗模型。

raw-image

上傳圖片:上傳衣服的圖片到 AI Studio,我是讓他幫我找個Model穿上這件衣服。

步驟 3:編輯圖片

  1. 輸入提示:在提示框中輸入「我會上傳一張衣服照片,幫我用臺灣女生的Model穿上它」的指令。
  2. 執行生成:點擊「Run」按鈕,AI 會自動生成一張新的圖片,將衣服套在模特兒身上。
  3. 調整結果:如果需要,可以進一步調整圖片,例如修改模特兒的姿勢或衣服的款式。

以下是我實作的成果

raw-image
raw-image

接著我讓它隨機穿上一件AI毛衣

raw-image


步驟 4:下載和分享

  1. 下載圖片:生成後,可以下載這張新的圖片。
  2. 分享到部落格或社交媒體:將這張圖片分享到部落格或社交媒體平台上。


因為本人沒有很勤勞,所以本篇文章產生的圖文都沒有再調校過,都是一次Prompt就貼上來了,如果有什麼小瑕疵請大家見諒吧!!~

但真的效果不錯,一次就能達到很好的效果。

使用 Google AI Studio 可以輕鬆地創造出逼真的服裝展示效果,甚至可以換髮型、改人物姿勢,甚至可以直接讓他產一篇圖文並茂的教學,很有趣,大家試試看吧!

參考資料

  • EP81 - Google推出超强AI修圖模型!基因編輯的重大革命:CRISPR(Part1)-科技浪 Tech.wav

Apple Podcast

Spotify



avatar-img
1會員
26內容數
這裡分享維那思的日常與異想
留言
avatar-img
留言分享你的想法!
維那思的異想世界 的其他內容
在 AI 快速發展的今天,常會遇到這樣的問題—AI 助理只能回答已知的資訊,卻無法主動存取最新的外部數據,例如即時查詢資料庫、管理檔案,甚至與網頁互動。而 MCP(Model Context Protocol)協定的誕生就是為了解決這個問題! MCP 是一種 開放原始碼協定,讓 AI 能夠輕鬆對接
本篇文章僅介紹我的無腦使用方法,可以直接解決我90%的生圖問題,進階細節我會推薦幾個網路上的資源,給需要深入學習的人去參考。 前言 還在困擾簡報製作或者部落格插圖的問題嗎?今天我要介紹好用的工具——Recraft AI!它是一款AI設計工具,可以幫助生成和編輯數字插圖、矢量圖、3D圖形等視覺內容
-=以Apple Podcast為例=- 有時候想要保存某些想要拿到電腦重複聽的重要Postcast,或者想做一些另外應用的處理,該怎麼取得相關的MP3檔案呢? 以Apple Podcast為例: 到Apple Podcast對應的頁面,找到喜歡想要重複聽的Podcast,於該頁面右鍵
Claude最近(2025年2月24日)出了新的3.7Sonnet被譽為目前最智能的模型,特別是在編程和開發領域展現出卓越的能力。 所以最近訂閱了Claude,聽說他能夠讓不會寫程式的人透過AI-assisted development的方法完成,而且需要修改的地方最少,所以試著來玩玩看。
在 AI 快速發展的今天,常會遇到這樣的問題—AI 助理只能回答已知的資訊,卻無法主動存取最新的外部數據,例如即時查詢資料庫、管理檔案,甚至與網頁互動。而 MCP(Model Context Protocol)協定的誕生就是為了解決這個問題! MCP 是一種 開放原始碼協定,讓 AI 能夠輕鬆對接
本篇文章僅介紹我的無腦使用方法,可以直接解決我90%的生圖問題,進階細節我會推薦幾個網路上的資源,給需要深入學習的人去參考。 前言 還在困擾簡報製作或者部落格插圖的問題嗎?今天我要介紹好用的工具——Recraft AI!它是一款AI設計工具,可以幫助生成和編輯數字插圖、矢量圖、3D圖形等視覺內容
-=以Apple Podcast為例=- 有時候想要保存某些想要拿到電腦重複聽的重要Postcast,或者想做一些另外應用的處理,該怎麼取得相關的MP3檔案呢? 以Apple Podcast為例: 到Apple Podcast對應的頁面,找到喜歡想要重複聽的Podcast,於該頁面右鍵
Claude最近(2025年2月24日)出了新的3.7Sonnet被譽為目前最智能的模型,特別是在編程和開發領域展現出卓越的能力。 所以最近訂閱了Claude,聽說他能夠讓不會寫程式的人透過AI-assisted development的方法完成,而且需要修改的地方最少,所以試著來玩玩看。
本篇參與的主題活動
你有沒有發現,人生中總有幾種人讓你忍不住多看幾眼? 不是因為他們長得特別帥、家裡特別有錢,而是他們總能在混亂中找到方向、別人都沒看到的地方發現機會 甚至,你還來不及反應,他們已經在前面三步了。 這種人,你可能以為是「天才」。 但其實,他們只是「開啟了某幾種特別的能力」。 而這些能力,
從根本上說,我們之所以是我們,是因為在某個無法控制的瞬間,另一個真實存在的人回應、拒絕或重新定義了我們。AI 只會永恆地迎合我們的期望,卻無法真正突破我們的自我界限。 如果我們完全隔絕於傷害與干擾之外,我們是否同時也喪失了成為真正「人」的可能性?
Elon Musk於Tesla全體員工大會上,分享了Tesla的未來藍圖,涵蓋電動車、自動駕駛、可持續能源、人形機器人Optimus等,最終願景為實現物質無虞的未來。演講重點提及Tesla的生產成就、工廠擴展、電池技術、自動駕駛技術及AI發展,以及Optimus人形機器人的生產計劃和市場潛力。
我寫小說,也畫畫,剛好方格子正在進行討論 AI 的話題,就來聊一下我自己怎麼運用 AI 的吧。 首先,我並不喜歡直接用 AI 生成的東西取代人工創作,如果可以的話,我會儘可能自己手工創作,因為我使用 AI 的技能並不好,只會跟 ChatGPT 聊天而已。我的經驗是,他創作出來的內容,其實不容易符合
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
你有沒有發現,人生中總有幾種人讓你忍不住多看幾眼? 不是因為他們長得特別帥、家裡特別有錢,而是他們總能在混亂中找到方向、別人都沒看到的地方發現機會 甚至,你還來不及反應,他們已經在前面三步了。 這種人,你可能以為是「天才」。 但其實,他們只是「開啟了某幾種特別的能力」。 而這些能力,
從根本上說,我們之所以是我們,是因為在某個無法控制的瞬間,另一個真實存在的人回應、拒絕或重新定義了我們。AI 只會永恆地迎合我們的期望,卻無法真正突破我們的自我界限。 如果我們完全隔絕於傷害與干擾之外,我們是否同時也喪失了成為真正「人」的可能性?
Elon Musk於Tesla全體員工大會上,分享了Tesla的未來藍圖,涵蓋電動車、自動駕駛、可持續能源、人形機器人Optimus等,最終願景為實現物質無虞的未來。演講重點提及Tesla的生產成就、工廠擴展、電池技術、自動駕駛技術及AI發展,以及Optimus人形機器人的生產計劃和市場潛力。
我寫小說,也畫畫,剛好方格子正在進行討論 AI 的話題,就來聊一下我自己怎麼運用 AI 的吧。 首先,我並不喜歡直接用 AI 生成的東西取代人工創作,如果可以的話,我會儘可能自己手工創作,因為我使用 AI 的技能並不好,只會跟 ChatGPT 聊天而已。我的經驗是,他創作出來的內容,其實不容易符合
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
你可能也想看
Google News 追蹤
Thumbnail
靈感用盡、鍵盤不再響,盯著喜歡、分享、留言的數字,心跳跟著小鈴鐺七上八下⋯⋯vocus 2025 年 4 月限定新商品,要為創作者打氣! 🚨「創作者打氣包」 最懂創作者的vocus,為創作者打造 ✨ 打氣包,包什麼?!四件道具挺創作者 一、【打氣復活卷】 專屬你的打氣小語,成功登記免費
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。 現在我們來載入預訓練權重,預訓練的權重包含 Transformer 的智慧
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
靈感用盡、鍵盤不再響,盯著喜歡、分享、留言的數字,心跳跟著小鈴鐺七上八下⋯⋯vocus 2025 年 4 月限定新商品,要為創作者打氣! 🚨「創作者打氣包」 最懂創作者的vocus,為創作者打造 ✨ 打氣包,包什麼?!四件道具挺創作者 一、【打氣復活卷】 專屬你的打氣小語,成功登記免費
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。 現在我們來載入預訓練權重,預訓練的權重包含 Transformer 的智慧
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,