AI繪圖工具大比拚,什麼叫做模型聽不聽得懂你講話(GPT-4o、Gemini、Copilot)

光淺JY-avatar-img
發佈於光淺的PM工作日誌 個房間
更新於 發佈於 閱讀時間約 5 分鐘


前陣子寫過一篇文章分享過,怎麼選擇合適的AI繪圖工具,其中有一點就是「模型聽不聽得懂你講話」。

剛好我最近因為參加臺北市青年局國際志工的活動,需要生成一些食譜用的照片,因此也來分享一下,模型「聽得懂」和「聽不懂」講話的差別。

先說結論:我覺得GPT-4o最聽得懂人話,但是運行時間也最長、還會限制你的使用次數,但幾乎可以一次到位;而Gemini與Copilot雖然(以生成圖片而言)運行的非常很快,但剩下的時間都用在讓你氣到吐血上了,而且很難透過prompt微調成指定條件。

測試一、煮小湯圓的食譜圖片

統一提示詞:畫圖片,這張圖片將用於食譜上,是煮小湯圓的時候,把小湯圓丟進去水煮且湯圓已經浮起來的示意圖

GPT-4o:非常精準,令人驚豔,甚至看不太出來是AI生成的!

Gemini:整體的畫風我也很喜歡,可惜他聽不出來小湯圓和大湯圓的差別,經過追加prompt「湯圓的尺寸還是太大了,再小一點,大概直徑1公分左右」,才成功畫成小湯圓。

Copilot:很顯然無法理解「食譜」要用的照片會有什麼樣的條件,第一張照片甚至只能用creepy形容,甚至畫面中有疑似有煮食人類、腳尾飯的內容,如果拿這張照片去做國際志工交流的話,我可能會被報警、被越南的警察給抓走……

測試二:準備冬瓜檸檬的材料圖片

統一提示詞:畫圖片,這張圖片將用於食譜上,照片中可以看到所需要的材料,分別是冬瓜茶和檸檬汁,其中冬瓜茶的份量較多、檸檬汁則只有一點點

GPT-4o:非常精準,甚至超額完成、在圖片中備註了材料的名稱!

Gemini:冬瓜、哈密瓜,傻傻分不清楚,雖然畫風很可愛,但是因為內容錯誤,所以無法使用。

Copilot:冬瓜、哈密瓜,傻傻分不清楚,甚至杯子裡面出現的是「苦瓜的皮+檸檬的內在」嗎?同樣因為內容錯誤,所以無法使用,而且他還出現了更多完全非我指定的內容,像是八角與肉桂。


測試三、攪拌冬瓜檸檬的圖片

統一提示詞:畫圖片,這張圖片將用於食譜上,照片中可以看到冬瓜茶和檸檬汁已經混合、攪拌均勻,變成一杯好喝的冬瓜檸檬茶

GPT-4o:中規中矩但符合要求、不出錯的圖片。

Gemini:創意驚人,非常優秀的創意,是唯一一個試圖以步驟呈現的,可惜執行成果跟不上,還是有冬瓜、哈密瓜分不清楚的問題,甚至出現了2個步驟4。

Copilot:一樣冬瓜、哈密瓜傻傻分不清楚,甚至出現無法辨認的「瓜」,整體的畫風就是很喜歡加上豐富的背景,需要提詞要求過後才可以提供較素的背景。

追加測試、在冬瓜檸檬裡面加湯圓

提示詞:畫圖片,這張圖片將用於食譜上,照片中是一杯冬瓜檸檬茶,並且加入白色的小湯圓,變成一杯好的冬瓜檸檬湯圓

經過3項測試,我已經放棄讓Gemini和Copilot分清楚冬瓜和哈密瓜的差別了,而且我也不知道為什麼硬要畫出這些奇奇怪怪的瓜出來,所以本段提詞只有在GPT-4o進行測試。

GPT-4o:杯緣和水面的折射處理得很細膩,但相對看得出是AI生成的圖片,而且翻譯的英文開始怪怪的,從lemon tea變成了lemon soup,推測是受到中文的「湯圓」的「湯」所影響。

另外這邊可以特別注意到的事情是,GPT-4o生成的圖片尺寸,不是永遠都一樣的,在本次的測試中,正方形、直式的長方形、橫式的長方形都有出現。當然這是因為我沒有要求,但如果你的用途有特定尺寸的需求,要特別注意能否生成指定的尺寸,或者輔以其他的工具協助。

題外話,雖然這項提詞的內容乍看之下非常詭異,怎麼會把湯圓放進酸酸的飲料裡面呢?不會臭臭苦苦的嗎?但是經過實際測試,把湯圓丟進又甜又酸的冬瓜檸檬裡面,真的滿好吃的,強烈歡迎大家試試看!

以上就是本次測試的全部內容,其實非常建議用相同的提詞同時去測試看看不同的AI繪圖工具,幫助你找到你最喜歡的風格、最符合需求的內容,最重要的是,以你的需求為主,可以參考別人喜歡的工具,但不一定跟風,最適合你的、才是最重要的。

留言
avatar-img
留言分享你的想法!
avatar-img
光淺JY的沙龍
11會員
43內容數
所有人都有生而為人的致命缺陷,每一個人都可以被分類,而我歌頌每一個人,因為我選擇善良。讓我偷偷跟你說,100種他們的故事。
光淺JY的沙龍的其他內容
2025/04/21
許多ChatGPT付費用戶誤以為已確保資料安全,卻忽略關閉「為所有人改善模型」設定,導致輸入資料仍可能被OpenAI用於訓練模型。本文提醒用戶務必檢查並關閉此設定,並建議去識別化敏感資料及避免上傳機密資訊,以確保資料安全。
Thumbnail
2025/04/21
許多ChatGPT付費用戶誤以為已確保資料安全,卻忽略關閉「為所有人改善模型」設定,導致輸入資料仍可能被OpenAI用於訓練模型。本文提醒用戶務必檢查並關閉此設定,並建議去識別化敏感資料及避免上傳機密資訊,以確保資料安全。
Thumbnail
2025/04/01
選擇適合的付費AI繪圖工具,關鍵不在於比較模型性能,而在於滿足實際需求、順手的UI介面以及有效的溝通。文章提供三步驟方法論:釐清特定需求(如私密生成、版權考量、文字排版、局部重繪、向量圖輸出),免費試用,找到順手的UI,最後選擇能理解你prompt的模型。
2025/04/01
選擇適合的付費AI繪圖工具,關鍵不在於比較模型性能,而在於滿足實際需求、順手的UI介面以及有效的溝通。文章提供三步驟方法論:釐清特定需求(如私密生成、版權考量、文字排版、局部重繪、向量圖輸出),免費試用,找到順手的UI,最後選擇能理解你prompt的模型。
2025/03/10
職場上總有令人不願做的工作,本文提供一套「必要性評估」策略,教你快速有效率地完成任務,並區分「黃金工作」與「垃圾工作」,讓你心安理得、提升工作效率。
Thumbnail
2025/03/10
職場上總有令人不願做的工作,本文提供一套「必要性評估」策略,教你快速有效率地完成任務,並區分「黃金工作」與「垃圾工作」,讓你心安理得、提升工作效率。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
本文比較了三個AI繪圖工具:GPT-4o、Gemini和Copilot在生成食譜圖片方面的表現,發現GPT-4o最能理解指令,生成圖片最符合要求,但運行時間較長且使用次數受限;Gemini和Copilot雖然運行速度快,但生成的圖片經常出現錯誤或與指令不符的情況,例如將冬瓜與哈密瓜混淆。
Thumbnail
本文比較了三個AI繪圖工具:GPT-4o、Gemini和Copilot在生成食譜圖片方面的表現,發現GPT-4o最能理解指令,生成圖片最符合要求,但運行時間較長且使用次數受限;Gemini和Copilot雖然運行速度快,但生成的圖片經常出現錯誤或與指令不符的情況,例如將冬瓜與哈密瓜混淆。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
在這個AI的時代,若不會使用AI軟體 或仍不敢嘗試AI軟體,那你就落伍了 由於目前多數AI生成APP,大都為英文介面 應此造成有些人不敢嘗試 今天這個問題將由微軟Copilot來完全解決 今天要談的是微軟Copilot的外掛程式 Image Creator,圖像創造器 它神奇之處是
Thumbnail
在這個AI的時代,若不會使用AI軟體 或仍不敢嘗試AI軟體,那你就落伍了 由於目前多數AI生成APP,大都為英文介面 應此造成有些人不敢嘗試 今天這個問題將由微軟Copilot來完全解決 今天要談的是微軟Copilot的外掛程式 Image Creator,圖像創造器 它神奇之處是
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
今天學習繪製一圖4分格的作品 作品集1:四季美人圖 作品集2:誰吃了我的蘋果
Thumbnail
AI繪圖也已經發展了好一段時間,這陣子也才真正的想要來試試看,以下分享的都是使用微軟的Copilot所畫出來,並附上prompt給大家參考,中英文都可以,有興趣的可以試試看,不過要小心,很容易上癮...
Thumbnail
AI繪圖也已經發展了好一段時間,這陣子也才真正的想要來試試看,以下分享的都是使用微軟的Copilot所畫出來,並附上prompt給大家參考,中英文都可以,有興趣的可以試試看,不過要小心,很容易上癮...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News