選A還B?無關乎內容,ChatGPT總偏好B

更新 發佈閱讀 3 分鐘
vocus|新世代的創作平台


ChatGPT-4o可能不具備判斷能力

用AI來進行準確有效的決策,或許是大多數人的期待。

但可惜ChatGPT似乎還不具備這樣的能力。

甚至可以肯定,他是「隨便」判斷的!

(對...還不是「隨機」是「隨便」)

在選A還B?的問題中,他幾乎無條件偏好選B。

當然,一些經過設計且帶有標準答案的問題(例如大學考題),

ChatGPT幾乎可以很輕鬆地答對。

不會沒事就愛選B選項。

然而,現實中大部分的決策都是複雜的。

舉例,行銷問題。

A產品名稱好?還是B產品名稱好?

A活動標語好?還是B活動標語好?

這種類型的問題,其實沒有標準答案。

但我們總需要經過一番掙扎之後,選出較好的那一個。

如果ChatGPT可以代勞這個「掙扎」就太好了。

於是在一個【家用除濕機】的標語文案決策中,我問ChatGPT-4o:

請評估以下A案和B案何者是更好的家用除濕機標語。

標準是能最大限度,吸引潛在消費者的注意力,引起購買的興趣。

最後的結論必須只能選一個

A:「清除濕氣,迎接乾爽新生活!」

B:「你的乾爽管家,24小時守護家。」

答案是:B【乾爽管家】,理由是「家」能夠觸動消費者的情感層面,為較有力的訴求。

但我知道ChatGPT的本質是基於機率計算的文字接龍機器。

所以只問一次不夠,我決定一字不改問20次。

連續20次,都得到答案是B。

正當我放心的時候,突然想...如果A跟B的選項交換看看呢?

改成

A:「你的乾爽管家,24小時守護家。」

B:「清除濕氣,迎接乾爽新生活!」

試了20次,結果傻眼了。

【乾爽管家】只被選中了1次!(原本20次)

【乾爽新生活】被選中了19次...(原本0次)

說好的「家的情感訴求」呢?

搞半天ChatGPT就是覺得放在B選項的答案比較好...

這簡直比隨機選還糟糕。

不信邪。

模型切成有推理能力的「o1-mini」,結果還是偏好B。

不信邪。

改問別的商品標語(量測工具),結果還是偏好B。

想想覺得可怕,假如今天的問題是

股票操盤 買進?賣出?

判決被告 有罪?無罪?

員工考核 資遣?續聘?

我會希望ChatGPT不是隨便回答我的。

本篇完。

留言
avatar-img
幻詠 Gen Ai Studio
37會員
133內容數
分享生成式AI 的各領域應用 1. AI 工具(ChatGPT、Gemini、Grok)實測&提示詞技巧 2. AI 創作內容(圖像、影視、動畫)
幻詠 Gen Ai Studio的其他內容
2025/04/29
善用AI解決真實的人生煩惱​ 先說結論, ChatGPT-4.5可以提供充足的情緒價值, ChatGPT-o1則可以洞察出問題的本質。
Thumbnail
2025/04/29
善用AI解決真實的人生煩惱​ 先說結論, ChatGPT-4.5可以提供充足的情緒價值, ChatGPT-o1則可以洞察出問題的本質。
Thumbnail
2025/04/25
ChatGPT依然有語言的資訊壁壘 一樣的問題,用不一樣的語言問ChatGPT答案一樣嗎? 結論是,實測體感大概7:3, 約3成的資訊,取決於和ChatGPT互動的語言。
Thumbnail
2025/04/25
ChatGPT依然有語言的資訊壁壘 一樣的問題,用不一樣的語言問ChatGPT答案一樣嗎? 結論是,實測體感大概7:3, 約3成的資訊,取決於和ChatGPT互動的語言。
Thumbnail
2025/04/23
以DeepResearch功能整理Andy老師事件懶人包為例 我有些後知後覺,沒有跟上這波議題。 有些好奇心想了解,但又覺得沒空研究。 我想是ChatGPT幫我們省時間的時候了。
Thumbnail
2025/04/23
以DeepResearch功能整理Andy老師事件懶人包為例 我有些後知後覺,沒有跟上這波議題。 有些好奇心想了解,但又覺得沒空研究。 我想是ChatGPT幫我們省時間的時候了。
Thumbnail
看更多
你可能也想看
Thumbnail
ChatGPT 公布後,人們開始思考:難靠 AI 生成需要的圖像,在於 AI 演算異於人類思考模式。 請同為人工智慧的 GPT 想提示詞,就能讓 SD 產出符合需求的圖片?
Thumbnail
ChatGPT 公布後,人們開始思考:難靠 AI 生成需要的圖像,在於 AI 演算異於人類思考模式。 請同為人工智慧的 GPT 想提示詞,就能讓 SD 產出符合需求的圖片?
Thumbnail
雖然它現在很紅,但還是幫不知道的人介紹一下它是什麼東西呢 不如...讓它自己介紹自己吧 基本上它的語言能力已經強到即使用中文溝通也不會讓中文人士覺得語句有不順暢的地方,當然它更強的是可以在所有領域的問題都找的到答案,例如: 但關於投資建議或是對於人類重要的選擇,它似乎會做很模稜兩可的回答 但由於它其
Thumbnail
雖然它現在很紅,但還是幫不知道的人介紹一下它是什麼東西呢 不如...讓它自己介紹自己吧 基本上它的語言能力已經強到即使用中文溝通也不會讓中文人士覺得語句有不順暢的地方,當然它更強的是可以在所有領域的問題都找的到答案,例如: 但關於投資建議或是對於人類重要的選擇,它似乎會做很模稜兩可的回答 但由於它其
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
「AI 會不會取代人類」這個議題甚囂塵上。我認為問題永遠在於如何善用工具解題,而不是擔心工具會不會做得比自己好。此篇將以目前最火紅的 chatGPT 舉例,分析服務優劣以及運用技巧。
Thumbnail
「AI 會不會取代人類」這個議題甚囂塵上。我認為問題永遠在於如何善用工具解題,而不是擔心工具會不會做得比自己好。此篇將以目前最火紅的 chatGPT 舉例,分析服務優劣以及運用技巧。
Thumbnail
不能找chatGPT做什麼呢? 千萬別找它找資料,它非常會編資料,它給的資料在網路上永遠找不到,後來我放棄了,因為它不能在網路上即時搜尋資料,所以在胡說八道上特別有模有樣。 ChatGPT是一種人工智慧語言模型,其功能和應用有一些限制。以下是一些ChatGPT可能無法滿足的要求: 即時網路搜尋
Thumbnail
不能找chatGPT做什麼呢? 千萬別找它找資料,它非常會編資料,它給的資料在網路上永遠找不到,後來我放棄了,因為它不能在網路上即時搜尋資料,所以在胡說八道上特別有模有樣。 ChatGPT是一種人工智慧語言模型,其功能和應用有一些限制。以下是一些ChatGPT可能無法滿足的要求: 即時網路搜尋
Thumbnail
ChatGPT是一種人工智慧技術,相比於其他智能助手如Siri,ChatGPT更聰明。這種技術的發展引起了投資者的關注,因為它背後帶來的投資機遇深度與廣度兼具,但對大多數人來說仍然不是非常容易理解。我計劃通過一系列文章來解讀ChatGPT帶來的機遇,並讓更多的投資者了解這個千載難逢的機會。
Thumbnail
ChatGPT是一種人工智慧技術,相比於其他智能助手如Siri,ChatGPT更聰明。這種技術的發展引起了投資者的關注,因為它背後帶來的投資機遇深度與廣度兼具,但對大多數人來說仍然不是非常容易理解。我計劃通過一系列文章來解讀ChatGPT帶來的機遇,並讓更多的投資者了解這個千載難逢的機會。
Thumbnail
(本文附圖皆截圖自ChatGPT) 廢話不多說,直接上圖。 第二個問法只比第一個問法多了一個「問號」,但是ChatGPT就會耗費比較多的運算力來處理,也就是說會比較「認真」去找答案。 第三個問法就更不用說了,他必須花費好幾倍的運算力,更加「認真」才能回答。 當然,它還是採取最安全、最制式化的方式回答
Thumbnail
(本文附圖皆截圖自ChatGPT) 廢話不多說,直接上圖。 第二個問法只比第一個問法多了一個「問號」,但是ChatGPT就會耗費比較多的運算力來處理,也就是說會比較「認真」去找答案。 第三個問法就更不用說了,他必須花費好幾倍的運算力,更加「認真」才能回答。 當然,它還是採取最安全、最制式化的方式回答
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
ChatGPT-4o可能不具備判斷能力 用AI來進行準確有效的決策,或許是大多數人的期待。 但可惜ChatGPT似乎還不具備這樣的能力。 甚至可以肯定,他是「隨便」判斷的! (對...還不是「隨機」是「隨便」) 在選A還B?的問題中,他幾乎無條件偏好選B。
Thumbnail
ChatGPT-4o可能不具備判斷能力 用AI來進行準確有效的決策,或許是大多數人的期待。 但可惜ChatGPT似乎還不具備這樣的能力。 甚至可以肯定,他是「隨便」判斷的! (對...還不是「隨機」是「隨便」) 在選A還B?的問題中,他幾乎無條件偏好選B。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
大部分人對chatGPT 既驚喜又懼怕,由11月30日推出至今卻愈來愈多人發生問題,我想在這裡簡易講述它的缺點並且提供其中一個解決方法。
Thumbnail
大部分人對chatGPT 既驚喜又懼怕,由11月30日推出至今卻愈來愈多人發生問題,我想在這裡簡易講述它的缺點並且提供其中一個解決方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News