AI繪圖工具大比拚，什麼叫做模型聽不聽得懂你講話（GPT-4o、Gemini、Copilot）

更新於 2025/04/16發佈於 2025/04/16閱讀時間約 5 分鐘

前陣子寫過一篇文章分享過，怎麼選擇合適的AI繪圖工具，其中有一點就是「模型聽不聽得懂你講話」。

剛好我最近因為參加臺北市青年局國際志工的活動，需要生成一些食譜用的照片，因此也來分享一下，模型「聽得懂」和「聽不懂」講話的差別。

先說結論：我覺得GPT-4o最聽得懂人話，但是運行時間也最長、還會限制你的使用次數，但幾乎可以一次到位；而Gemini與Copilot雖然（以生成圖片而言）運行的非常很快，但剩下的時間都用在讓你氣到吐血上了，而且很難透過prompt微調成指定條件。

測試一、煮小湯圓的食譜圖片

統一提示詞：畫圖片，這張圖片將用於食譜上，是煮小湯圓的時候，把小湯圓丟進去水煮且湯圓已經浮起來的示意圖

GPT-4o：非常精準，令人驚豔，甚至看不太出來是AI生成的！

GPT-4o煮小湯圓

Gemini：整體的畫風我也很喜歡，可惜他聽不出來小湯圓和大湯圓的差別，經過追加prompt「湯圓的尺寸還是太大了，再小一點，大概直徑1公分左右」，才成功畫成小湯圓。

Copilot：很顯然無法理解「食譜」要用的照片會有什麼樣的條件，第一張照片甚至只能用creepy形容，甚至畫面中有疑似有煮食人類、腳尾飯的內容，如果拿這張照片去做國際志工交流的話，我可能會被報警、被越南的警察給抓走……

測試二：準備冬瓜檸檬的材料圖片

統一提示詞：畫圖片，這張圖片將用於食譜上，照片中可以看到所需要的材料，分別是冬瓜茶和檸檬汁，其中冬瓜茶的份量較多、檸檬汁則只有一點點

GPT-4o：非常精準，甚至超額完成、在圖片中備註了材料的名稱！

GPT-4o冬瓜檸檬材料

Gemini：冬瓜、哈密瓜，傻傻分不清楚，雖然畫風很可愛，但是因為內容錯誤，所以無法使用。

Copilot：冬瓜、哈密瓜，傻傻分不清楚，甚至杯子裡面出現的是「苦瓜的皮＋檸檬的內在」嗎？同樣因為內容錯誤，所以無法使用，而且他還出現了更多完全非我指定的內容，像是八角與肉桂。

測試三、攪拌冬瓜檸檬的圖片

統一提示詞：畫圖片，這張圖片將用於食譜上，照片中可以看到冬瓜茶和檸檬汁已經混合、攪拌均勻，變成一杯好喝的冬瓜檸檬茶

GPT-4o：中規中矩但符合要求、不出錯的圖片。

GPT-4o攪拌冬瓜檸檬

Gemini：創意驚人，非常優秀的創意，是唯一一個試圖以步驟呈現的，可惜執行成果跟不上，還是有冬瓜、哈密瓜分不清楚的問題，甚至出現了2個步驟4。

Copilot：一樣冬瓜、哈密瓜傻傻分不清楚，甚至出現無法辨認的「瓜」，整體的畫風就是很喜歡加上豐富的背景，需要提詞要求過後才可以提供較素的背景。

追加測試、在冬瓜檸檬裡面加湯圓

提示詞：畫圖片，這張圖片將用於食譜上，照片中是一杯冬瓜檸檬茶，並且加入白色的小湯圓，變成一杯好的冬瓜檸檬湯圓

經過3項測試，我已經放棄讓Gemini和Copilot分清楚冬瓜和哈密瓜的差別了，而且我也不知道為什麼硬要畫出這些奇奇怪怪的瓜出來，所以本段提詞只有在GPT-4o進行測試。

GPT-4o：杯緣和水面的折射處理得很細膩，但相對看得出是AI生成的圖片，而且翻譯的英文開始怪怪的，從lemon tea變成了lemon soup，推測是受到中文的「湯圓」的「湯」所影響。

GPT-4o冬瓜檸檬加湯圓

另外這邊可以特別注意到的事情是，GPT-4o生成的圖片尺寸，不是永遠都一樣的，在本次的測試中，正方形、直式的長方形、橫式的長方形都有出現。當然這是因為我沒有要求，但如果你的用途有特定尺寸的需求，要特別注意能否生成指定的尺寸，或者輔以其他的工具協助。

題外話，雖然這項提詞的內容乍看之下非常詭異，怎麼會把湯圓放進酸酸的飲料裡面呢？不會臭臭苦苦的嗎？但是經過實際測試，把湯圓丟進又甜又酸的冬瓜檸檬裡面，真的滿好吃的，強烈歡迎大家試試看！

以上就是本次測試的全部內容，其實非常建議用相同的提詞同時去測試看看不同的AI繪圖工具，幫助你找到你最喜歡的風格、最符合需求的內容，最重要的是，以你的需求為主，可以參考別人喜歡的工具，但不一定跟風，最適合你的、才是最重要的。

光淺JY的沙龍越南國際志工光淺JY的沙龍光淺的PM工作日誌

留言

留言分享你的想法！

光淺JY的沙龍

11會員

43內容數

所有人都有生而為人的致命缺陷，每一個人都可以被分類，而我歌頌每一個人，因為我選擇善良。讓我偷偷跟你說，100種他們的故事。

光淺JY的沙龍的其他內容

2025/04/21

ChatGPT付費也危險？設定沒關，你的資料可能被AI拿去訓練！

許多ChatGPT付費用戶誤以為已確保資料安全，卻忽略關閉「為所有人改善模型」設定，導致輸入資料仍可能被OpenAI用於訓練模型。本文提醒用戶務必檢查並關閉此設定，並建議去識別化敏感資料及避免上傳機密資訊，以確保資料安全。

2025/04/21

ChatGPT付費也危險？設定沒關，你的資料可能被AI拿去訓練！

2025/04/01

AI繪圖工具選擇3步驟：特定需求先行、UI次之、模型聽得懂話就好

選擇適合的付費AI繪圖工具，關鍵不在於比較模型性能，而在於滿足實際需求、順手的UI介面以及有效的溝通。文章提供三步驟方法論：釐清特定需求（如私密生成、版權考量、文字排版、局部重繪、向量圖輸出），免費試用，找到順手的UI，最後選擇能理解你prompt的模型。

2025/04/01

AI繪圖工具選擇3步驟：特定需求先行、UI次之、模型聽得懂話就好

2025/03/10

面對不喜歡的工作，如何用最快的速度消滅它？

職場上總有令人不願做的工作，本文提供一套「必要性評估」策略，教你快速有效率地完成任務，並區分「黃金工作」與「垃圾工作」，讓你心安理得、提升工作效率。

2025/03/10

面對不喜歡的工作，如何用最快的速度消滅它？

#AI 的其他內容

PLTR 25Q1 財報 - 營收獲利皆歷史新高，Palantir 再次展示 AI 贏家之姿 | #271

財經咖啡因的窩

「人性總是在最不相信時錯過機會」#落後的華爾街#紛紛開始講去年我們就說得各國一定會瘋狂搶黃金

碎進時間的裂縫

創作覺察：每一次的書寫，都像在回應「我是誰」

你可能也想看

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

大家好，我是一名眼科醫師，也是一位孩子的媽身為眼科醫師的我，我知道視力發展對孩子來說有多關鍵。每到開學季時，診間便充斥著許多憂心忡忡的家屬。近年來看診中，兒童提早近視、眼睛疲勞的案例明顯增加，除了3C使用過度，最常被忽略的，就是照明品質。然而作為一位媽媽，孩子能在安全、舒適的環境

#momo購物網#Philips飛利浦#軒博

2025/04/30

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

#momo購物網#Philips飛利浦#軒博

2025/04/30

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

我的「媽」呀！母親節即將到來，vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常，或是一直想對她表達的感謝，又或者，是你這輩子最想聽她說出的一句話。也歡迎你曬出合照，分享照片背後的點點滴滴 ♥️ 透過創作，將這份情感表達出來吧！🥹

#母親節#媽媽美照#媽媽日常

2025/05/01

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

#母親節#媽媽美照#媽媽日常

2025/05/01

光淺JY的沙龍

AI繪圖工具大比拚，什麼叫做模型聽不聽得懂你講話（GPT-4o、Gemini、Copilot）

本文比較了三個AI繪圖工具：GPT-4o、Gemini和Copilot在生成食譜圖片方面的表現，發現GPT-4o最能理解指令，生成圖片最符合要求，但運行時間較長且使用次數受限；Gemini和Copilot雖然運行速度快，但生成的圖片經常出現錯誤或與指令不符的情況，例如將冬瓜與哈密瓜混淆。

#國際志工#AI繪圖#臺北市青年局

2025/04/16

光淺JY的沙龍

AI繪圖工具大比拚，什麼叫做模型聽不聽得懂你講話（GPT-4o、Gemini、Copilot）

#國際志工#AI繪圖#臺北市青年局

2025/04/16

是我啦，我好學啦

AI可以讓你的作品變更好看嗎？答案是「有困難」

AI繪圖要廣泛用於商用還有一大段路，還需要依賴人類的經驗判斷、調整，為什麼呢？

#AI繪圖#midjourney繪圖#AI套現

2024/07/24

是我啦，我好學啦

AI可以讓你的作品變更好看嗎？答案是「有困難」

AI繪圖要廣泛用於商用還有一大段路，還需要依賴人類的經驗判斷、調整，為什麼呢？

#AI繪圖#midjourney繪圖#AI套現

2024/07/24

漫步筆記的沙龍

測試一下用copilot畫AI正在畫一張圖

2024/06/16

漫步筆記的沙龍

測試一下用copilot畫AI正在畫一張圖

2024/06/16

許博輕鬆學

用AI生成圖片So Easy

在這個AI的時代，若不會使用AI軟體或仍不敢嘗試AI軟體，那你就落伍了由於目前多數AI生成APP，大都為英文介面應此造成有些人不敢嘗試今天這個問題將由微軟Copilot來完全解決今天要談的是微軟Copilot的外掛程式 Image Creator，圖像創造器它神奇之處是

2024/06/04

2024/06/04

AI -Gemini : 我鼓勵你探索自己的答案，並找到讓你感到充實和意義的東西。我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來？” “現在發生的事情的品質如何？” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型，在大量文字和程式碼...

2024/05/24

2024/05/24

進化為GPT-4o 可以聊天兼翻譯，圖片辨識大有進展。不用十年，不到兩年AI已可取代許多人類庶務

2024年5月13日，Openai發布了新一代的模組GPT-4o，念法：GPT-four-O。強調即時對話以及圖像解析能力，官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析，以及幾乎可媲美真人的語音回應，包含調整語氣、用詞以及模仿機器人語音等，相當令人驚豔。

#GPT4o#ChatGPT#Openai

2024/05/14

德意志黑眼圈

進化為GPT-4o 可以聊天兼翻譯，圖片辨識大有進展。不用十年，不到兩年AI已可取代許多人類庶務

#GPT4o#ChatGPT#Openai

2024/05/14

樂子

Google Gemini 對比 ChatGPT：AI助手評測

這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現，並對比了它們在簡單問題、創作文本和回應短文等方面的效果。

#ChatGPT#AI#人工智慧

2024/04/30

樂子

Google Gemini 對比 ChatGPT：AI助手評測

這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現，並對比了它們在簡單問題、創作文本和回應短文等方面的效果。

#ChatGPT#AI#人工智慧

2024/04/30

美麗溫柔的沙龍

AI繪圖-四季美人圖(一圖4分格)

今天學習繪製一圖4分格的作品作品集1：四季美人圖作品集2：誰吃了我的蘋果

#AI繪圖#Bing繪圖#Bing

2024/04/15

美麗溫柔的沙龍

AI繪圖-四季美人圖(一圖4分格)

今天學習繪製一圖4分格的作品作品集1：四季美人圖作品集2：誰吃了我的蘋果

#AI繪圖#Bing繪圖#Bing

2024/04/15

Hugo慢半拍

【Copilot】AI繪圖初體驗 - 龍年賀年卡

AI繪圖也已經發展了好一段時間，這陣子也才真正的想要來試試看，以下分享的都是使用微軟的Copilot所畫出來，並附上prompt給大家參考，中英文都可以，有興趣的可以試試看，不過要小心，很容易上癮...

#AI繪圖#Copilot

2024/02/12

Hugo慢半拍

【Copilot】AI繪圖初體驗 - 龍年賀年卡

#AI繪圖#Copilot

2024/02/12

CV教養生活 | Vita Huang

[反思]AI會變成靈感建議師？我看到新夥伴Gemini加入行列

AI只是個工具，不需要整個作品都是AI主導。

#貓咪#孩子#Google

2023/12/08

CV教養生活 | Vita Huang

[反思]AI會變成靈感建議師？我看到新夥伴Gemini加入行列

AI只是個工具，不需要整個作品都是AI主導。

#貓咪#孩子#Google

2023/12/08

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News