選A還B?無關乎內容,ChatGPT總偏好B

更新於 發佈於 閱讀時間約 3 分鐘
raw-image


ChatGPT-4o可能不具備判斷能力

用AI來進行準確有效的決策,或許是大多數人的期待。

但可惜ChatGPT似乎還不具備這樣的能力。

甚至可以肯定,他是「隨便」判斷的!

(對...還不是「隨機」是「隨便」)

在選A還B?的問題中,他幾乎無條件偏好選B。

當然,一些經過設計且帶有標準答案的問題(例如大學考題),

ChatGPT幾乎可以很輕鬆地答對。

不會沒事就愛選B選項。

然而,現實中大部分的決策都是複雜的。

舉例,行銷問題。

A產品名稱好?還是B產品名稱好?

A活動標語好?還是B活動標語好?

這種類型的問題,其實沒有標準答案。

但我們總需要經過一番掙扎之後,選出較好的那一個。

如果ChatGPT可以代勞這個「掙扎」就太好了。

於是在一個【家用除濕機】的標語文案決策中,我問ChatGPT-4o:

請評估以下A案和B案何者是更好的家用除濕機標語。

標準是能最大限度,吸引潛在消費者的注意力,引起購買的興趣。

最後的結論必須只能選一個

A:「清除濕氣,迎接乾爽新生活!」

B:「你的乾爽管家,24小時守護家。」

答案是:B【乾爽管家】,理由是「家」能夠觸動消費者的情感層面,為較有力的訴求。

但我知道ChatGPT的本質是基於機率計算的文字接龍機器。

所以只問一次不夠,我決定一字不改問20次。

連續20次,都得到答案是B。

正當我放心的時候,突然想...如果A跟B的選項交換看看呢?

改成

A:「你的乾爽管家,24小時守護家。」

B:「清除濕氣,迎接乾爽新生活!」

試了20次,結果傻眼了。

【乾爽管家】只被選中了1次!(原本20次)

【乾爽新生活】被選中了19次...(原本0次)

說好的「家的情感訴求」呢?

搞半天ChatGPT就是覺得放在B選項的答案比較好...

這簡直比隨機選還糟糕。

不信邪。

模型切成有推理能力的「o1-mini」,結果還是偏好B。

不信邪。

改問別的商品標語(量測工具),結果還是偏好B。

想想覺得可怕,假如今天的問題是

股票操盤 買進?賣出?

判決被告 有罪?無罪?

員工考核 資遣?續聘?

我會希望ChatGPT不是隨便回答我的。

本篇完。

留言
avatar-img
留言分享你的想法!
avatar-img
幻詠 Gen Ai Studio
7會員
96內容數
探索ChatGPT等生成式AI 的各領域應用 1.分享 AI 工具的實測結果&提示詞技巧 2.分享 AI 創作內容
幻詠 Gen Ai Studio的其他內容
2025/04/29
善用AI解決真實的人生煩惱​ 先說結論, ChatGPT-4.5可以提供充足的情緒價值, ChatGPT-o1則可以洞察出問題的本質。
Thumbnail
2025/04/29
善用AI解決真實的人生煩惱​ 先說結論, ChatGPT-4.5可以提供充足的情緒價值, ChatGPT-o1則可以洞察出問題的本質。
Thumbnail
2025/04/25
ChatGPT依然有語言的資訊壁壘 一樣的問題,用不一樣的語言問ChatGPT答案一樣嗎? 結論是,實測體感大概7:3, 約3成的資訊,取決於和ChatGPT互動的語言。
Thumbnail
2025/04/25
ChatGPT依然有語言的資訊壁壘 一樣的問題,用不一樣的語言問ChatGPT答案一樣嗎? 結論是,實測體感大概7:3, 約3成的資訊,取決於和ChatGPT互動的語言。
Thumbnail
2025/04/23
以DeepResearch功能整理Andy老師事件懶人包為例 我有些後知後覺,沒有跟上這波議題。 有些好奇心想了解,但又覺得沒空研究。 我想是ChatGPT幫我們省時間的時候了。
Thumbnail
2025/04/23
以DeepResearch功能整理Andy老師事件懶人包為例 我有些後知後覺,沒有跟上這波議題。 有些好奇心想了解,但又覺得沒空研究。 我想是ChatGPT幫我們省時間的時候了。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
ChatGPT 公布後,人們開始思考:難靠 AI 生成需要的圖像,在於 AI 演算異於人類思考模式。 請同為人工智慧的 GPT 想提示詞,就能讓 SD 產出符合需求的圖片?
Thumbnail
ChatGPT 公布後,人們開始思考:難靠 AI 生成需要的圖像,在於 AI 演算異於人類思考模式。 請同為人工智慧的 GPT 想提示詞,就能讓 SD 產出符合需求的圖片?
Thumbnail
ChatGPT-4o可能不具備判斷能力 用AI來進行準確有效的決策,或許是大多數人的期待。 但可惜ChatGPT似乎還不具備這樣的能力。 甚至可以肯定,他是「隨便」判斷的! (對...還不是「隨機」是「隨便」) 在選A還B?的問題中,他幾乎無條件偏好選B。
Thumbnail
ChatGPT-4o可能不具備判斷能力 用AI來進行準確有效的決策,或許是大多數人的期待。 但可惜ChatGPT似乎還不具備這樣的能力。 甚至可以肯定,他是「隨便」判斷的! (對...還不是「隨機」是「隨便」) 在選A還B?的問題中,他幾乎無條件偏好選B。
Thumbnail
不能找chatGPT做什麼呢? 千萬別找它找資料,它非常會編資料,它給的資料在網路上永遠找不到,後來我放棄了,因為它不能在網路上即時搜尋資料,所以在胡說八道上特別有模有樣。 ChatGPT是一種人工智慧語言模型,其功能和應用有一些限制。以下是一些ChatGPT可能無法滿足的要求: 即時網路搜尋
Thumbnail
不能找chatGPT做什麼呢? 千萬別找它找資料,它非常會編資料,它給的資料在網路上永遠找不到,後來我放棄了,因為它不能在網路上即時搜尋資料,所以在胡說八道上特別有模有樣。 ChatGPT是一種人工智慧語言模型,其功能和應用有一些限制。以下是一些ChatGPT可能無法滿足的要求: 即時網路搜尋
Thumbnail
雖然它現在很紅,但還是幫不知道的人介紹一下它是什麼東西呢 不如...讓它自己介紹自己吧 基本上它的語言能力已經強到即使用中文溝通也不會讓中文人士覺得語句有不順暢的地方,當然它更強的是可以在所有領域的問題都找的到答案,例如: 但關於投資建議或是對於人類重要的選擇,它似乎會做很模稜兩可的回答 但由於它其
Thumbnail
雖然它現在很紅,但還是幫不知道的人介紹一下它是什麼東西呢 不如...讓它自己介紹自己吧 基本上它的語言能力已經強到即使用中文溝通也不會讓中文人士覺得語句有不順暢的地方,當然它更強的是可以在所有領域的問題都找的到答案,例如: 但關於投資建議或是對於人類重要的選擇,它似乎會做很模稜兩可的回答 但由於它其
Thumbnail
大部分人對chatGPT 既驚喜又懼怕,由11月30日推出至今卻愈來愈多人發生問題,我想在這裡簡易講述它的缺點並且提供其中一個解決方法。
Thumbnail
大部分人對chatGPT 既驚喜又懼怕,由11月30日推出至今卻愈來愈多人發生問題,我想在這裡簡易講述它的缺點並且提供其中一個解決方法。
Thumbnail
「AI 會不會取代人類」這個議題甚囂塵上。我認為問題永遠在於如何善用工具解題,而不是擔心工具會不會做得比自己好。此篇將以目前最火紅的 chatGPT 舉例,分析服務優劣以及運用技巧。
Thumbnail
「AI 會不會取代人類」這個議題甚囂塵上。我認為問題永遠在於如何善用工具解題,而不是擔心工具會不會做得比自己好。此篇將以目前最火紅的 chatGPT 舉例,分析服務優劣以及運用技巧。
Thumbnail
ChatGPT是一種人工智慧技術,相比於其他智能助手如Siri,ChatGPT更聰明。這種技術的發展引起了投資者的關注,因為它背後帶來的投資機遇深度與廣度兼具,但對大多數人來說仍然不是非常容易理解。我計劃通過一系列文章來解讀ChatGPT帶來的機遇,並讓更多的投資者了解這個千載難逢的機會。
Thumbnail
ChatGPT是一種人工智慧技術,相比於其他智能助手如Siri,ChatGPT更聰明。這種技術的發展引起了投資者的關注,因為它背後帶來的投資機遇深度與廣度兼具,但對大多數人來說仍然不是非常容易理解。我計劃通過一系列文章來解讀ChatGPT帶來的機遇,並讓更多的投資者了解這個千載難逢的機會。
Thumbnail
(本文附圖皆截圖自ChatGPT) 廢話不多說,直接上圖。 第二個問法只比第一個問法多了一個「問號」,但是ChatGPT就會耗費比較多的運算力來處理,也就是說會比較「認真」去找答案。 第三個問法就更不用說了,他必須花費好幾倍的運算力,更加「認真」才能回答。 當然,它還是採取最安全、最制式化的方式回答
Thumbnail
(本文附圖皆截圖自ChatGPT) 廢話不多說,直接上圖。 第二個問法只比第一個問法多了一個「問號」,但是ChatGPT就會耗費比較多的運算力來處理,也就是說會比較「認真」去找答案。 第三個問法就更不用說了,他必須花費好幾倍的運算力,更加「認真」才能回答。 當然,它還是採取最安全、最制式化的方式回答
Thumbnail
最近最火的話題肯定是Chatgpt了,不蹭它一波真的太可惜。 ​不過雖然說是蹭、我堂堂NLP心理學平台、又不是程式設計、或是什麼研究人工智能的帳號,這該怎麼蹭?從何蹭起? ​這邊會以NLP四大導師、心智生態學的Gregory Bateson的後設認知觀點,來切入探討。 ​
Thumbnail
最近最火的話題肯定是Chatgpt了,不蹭它一波真的太可惜。 ​不過雖然說是蹭、我堂堂NLP心理學平台、又不是程式設計、或是什麼研究人工智能的帳號,這該怎麼蹭?從何蹭起? ​這邊會以NLP四大導師、心智生態學的Gregory Bateson的後設認知觀點,來切入探討。 ​
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News