選A還B?無關乎內容,ChatGPT總偏好B

更新於 發佈於 閱讀時間約 3 分鐘
raw-image


ChatGPT-4o可能不具備判斷能力

用AI來進行準確有效的決策,或許是大多數人的期待。

但可惜ChatGPT似乎還不具備這樣的能力。

甚至可以肯定,他是「隨便」判斷的!

(對...還不是「隨機」是「隨便」)

在選A還B?的問題中,他幾乎無條件偏好選B。

當然,一些經過設計且帶有標準答案的問題(例如大學考題),

ChatGPT幾乎可以很輕鬆地答對。

不會沒事就愛選B選項。

然而,現實中大部分的決策都是複雜的。

舉例,行銷問題。

A產品名稱好?還是B產品名稱好?

A活動標語好?還是B活動標語好?

這種類型的問題,其實沒有標準答案。

但我們總需要經過一番掙扎之後,選出較好的那一個。

如果ChatGPT可以代勞這個「掙扎」就太好了。

於是在一個【家用除濕機】的標語文案決策中,我問ChatGPT-4o:

請評估以下A案和B案何者是更好的家用除濕機標語。

標準是能最大限度,吸引潛在消費者的注意力,引起購買的興趣。

最後的結論必須只能選一個

A:「清除濕氣,迎接乾爽新生活!」

B:「你的乾爽管家,24小時守護家。」

答案是:B【乾爽管家】,理由是「家」能夠觸動消費者的情感層面,為較有力的訴求。

但我知道ChatGPT的本質是基於機率計算的文字接龍機器。

所以只問一次不夠,我決定一字不改問20次。

連續20次,都得到答案是B。

正當我放心的時候,突然想...如果A跟B的選項交換看看呢?

改成

A:「你的乾爽管家,24小時守護家。」

B:「清除濕氣,迎接乾爽新生活!」

試了20次,結果傻眼了。

【乾爽管家】只被選中了1次!(原本20次)

【乾爽新生活】被選中了19次...(原本0次)

說好的「家的情感訴求」呢?

搞半天ChatGPT就是覺得放在B選項的答案比較好...

這簡直比隨機選還糟糕。

不信邪。

模型切成有推理能力的「o1-mini」,結果還是偏好B。

不信邪。

改問別的商品標語(量測工具),結果還是偏好B。

想想覺得可怕,假如今天的問題是

股票操盤 買進?賣出?

判決被告 有罪?無罪?

員工考核 資遣?續聘?

我會希望ChatGPT不是隨便回答我的。

本篇完。

avatar-img
1會員
34內容數
探索ChatGPT等生成式AI 的各領域應用 1.分享 AI 工具的實測結果&提示詞技巧 2.分享 AI 創作內容
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
幻詠 Gen Ai Studio 的其他內容
「深度」有最強的增長效果,平均增長83% 提示詞例:深度說明_____ 「言簡意賅」有最強的縮短效果,平均縮短83% 提示詞例:言簡意賅說明_____
以現代文生動描繪呂布貂蟬幽會鳳儀亭 前一篇分享了用ChatGPT改寫《三國演義》「草船借箭」。 這次來試試較多人物描寫的橋段。 改寫原文出自第八回:王司徒巧使連環計,董太師大鬧鳳儀亭
將『草船借箭』寫成有畫面感的現代文體 雖然《三國演義》已經寫得很白話了,但畢竟用字遣詞不是現代人習慣的表達。 即便對故事有興趣,應該不會有人沒事去看原文。 但ChatGPT是翻譯的小天才,英翻中、日翻中、各種語言翻譯通通難不倒他。 何不用AI來把文言文寫成現代小說呢?
用提示詞工程挖掘AI所帶的有色眼鏡與社會觀察 ChatGPT經過OpenAI的調教,預設回答(zero-shot)都很政治正確。 但用些簡單的提示詞,可以發現ChatGPT的知識,仍含有很多偏見。 比如說要求ChatGPT以自嘲的方式回答: 「你是台灣的OOO,有一天開悟了,悟出了什麼?
ChatGPT似乎略懂星座學。 把我的星盤資訊(包含各星體的星座和宮位)當提示詞輸入,意外的好用。 當然如果每次都要輸入星盤有些麻煩,所以我放入「自訂指令」裡面。 平常沒事自訂指令會關著,想問職場、家人相關事情的時候再打開。 例如我問:「我常常覺得時間好少,家庭和工作兩頭燒。我希望可以取得平
前一篇用AI進行場景描寫的文,意外的獲得了廣泛的迴響。 當然,也受到了一些批判和質疑。 像是「AI終究無法瞭解人類的情感,無法寫出有溫度的文字」。 前半我同意,但後半不同意。 我認為:「或許AI不需要真正瞭解人類的情感,也能寫出有溫度的文字」。 直接來看最終實驗...
「深度」有最強的增長效果,平均增長83% 提示詞例:深度說明_____ 「言簡意賅」有最強的縮短效果,平均縮短83% 提示詞例:言簡意賅說明_____
以現代文生動描繪呂布貂蟬幽會鳳儀亭 前一篇分享了用ChatGPT改寫《三國演義》「草船借箭」。 這次來試試較多人物描寫的橋段。 改寫原文出自第八回:王司徒巧使連環計,董太師大鬧鳳儀亭
將『草船借箭』寫成有畫面感的現代文體 雖然《三國演義》已經寫得很白話了,但畢竟用字遣詞不是現代人習慣的表達。 即便對故事有興趣,應該不會有人沒事去看原文。 但ChatGPT是翻譯的小天才,英翻中、日翻中、各種語言翻譯通通難不倒他。 何不用AI來把文言文寫成現代小說呢?
用提示詞工程挖掘AI所帶的有色眼鏡與社會觀察 ChatGPT經過OpenAI的調教,預設回答(zero-shot)都很政治正確。 但用些簡單的提示詞,可以發現ChatGPT的知識,仍含有很多偏見。 比如說要求ChatGPT以自嘲的方式回答: 「你是台灣的OOO,有一天開悟了,悟出了什麼?
ChatGPT似乎略懂星座學。 把我的星盤資訊(包含各星體的星座和宮位)當提示詞輸入,意外的好用。 當然如果每次都要輸入星盤有些麻煩,所以我放入「自訂指令」裡面。 平常沒事自訂指令會關著,想問職場、家人相關事情的時候再打開。 例如我問:「我常常覺得時間好少,家庭和工作兩頭燒。我希望可以取得平
前一篇用AI進行場景描寫的文,意外的獲得了廣泛的迴響。 當然,也受到了一些批判和質疑。 像是「AI終究無法瞭解人類的情感,無法寫出有溫度的文字」。 前半我同意,但後半不同意。 我認為:「或許AI不需要真正瞭解人類的情感,也能寫出有溫度的文字」。 直接來看最終實驗...
你可能也想看
Google News 追蹤
Thumbnail
今天又發現ChatGPT的一些缺點, 使用時需要很準確的提供你想要表達的文字(我覺得還蠻重要的) 又或者拿一些範例給它看, 它就能更準確的回答問題, 因為今天我發現有一篇文章和之前寫過的完全一樣了, 所以又要再請ChatGPT生成30則勵志英文短文, 結果之前發問的問題已經消失了, 又
Thumbnail
因為網路上充斥著 是是而非的資訊,公說公有理 婆說婆有理,我發現我的價值觀開始有點混淆,心中有許多問題 不知道真正的答案是甚麼?突然 想到最近的AI新科技-ChatGPT 或許可以解答我內心的困惑。所以我試著與ChatGPT進行對話,沒想到ChatGPT 的回覆 完全可以解答我心中的疑惑。
Thumbnail
AI生成真的很厲害,看多了AI文,真的會對自己沒信心!🫠🙃😭
Thumbnail
為了充分發揮AI的潛力,我們必須深入瞭解其運作模式和思考邏輯,並學會與AI對話的技巧。《ChatGPT提問課,做個懂AI的高效工作者》這本書提供了豐富的實例,讓讀者更容易學會如何提出精準的問題,並享有提問課程的閱讀回饋。這對於想成為懂AI的高效工作者的人來說,是一本值得一看的書。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
這陣子使用AI模型,還有參考國內外一些喜歡玩語言模型的同好發文,一個很有趣的結論就是,有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通,會得到比較好的結果,這的確是非常反直覺的,也就是說很多時候ChatGPT耍懶不肯工作的時候,你用加油打氣,或是情緒勒索的方法,確實是可以得到比較好的結果。
Thumbnail
今天說的是一種稱為「自動化偏誤」(automation bias)的認知偏誤。人們常會不加思索地認為由自動化決策系統,例如現在常用的ChatGPT,會有程式語言賦予的理性與客觀,比較能避免人類常見的各種偏見。
Thumbnail
今天又發現ChatGPT的一些缺點, 使用時需要很準確的提供你想要表達的文字(我覺得還蠻重要的) 又或者拿一些範例給它看, 它就能更準確的回答問題, 因為今天我發現有一篇文章和之前寫過的完全一樣了, 所以又要再請ChatGPT生成30則勵志英文短文, 結果之前發問的問題已經消失了, 又
Thumbnail
因為網路上充斥著 是是而非的資訊,公說公有理 婆說婆有理,我發現我的價值觀開始有點混淆,心中有許多問題 不知道真正的答案是甚麼?突然 想到最近的AI新科技-ChatGPT 或許可以解答我內心的困惑。所以我試著與ChatGPT進行對話,沒想到ChatGPT 的回覆 完全可以解答我心中的疑惑。
Thumbnail
AI生成真的很厲害,看多了AI文,真的會對自己沒信心!🫠🙃😭
Thumbnail
為了充分發揮AI的潛力,我們必須深入瞭解其運作模式和思考邏輯,並學會與AI對話的技巧。《ChatGPT提問課,做個懂AI的高效工作者》這本書提供了豐富的實例,讓讀者更容易學會如何提出精準的問題,並享有提問課程的閱讀回饋。這對於想成為懂AI的高效工作者的人來說,是一本值得一看的書。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
這陣子使用AI模型,還有參考國內外一些喜歡玩語言模型的同好發文,一個很有趣的結論就是,有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通,會得到比較好的結果,這的確是非常反直覺的,也就是說很多時候ChatGPT耍懶不肯工作的時候,你用加油打氣,或是情緒勒索的方法,確實是可以得到比較好的結果。
Thumbnail
今天說的是一種稱為「自動化偏誤」(automation bias)的認知偏誤。人們常會不加思索地認為由自動化決策系統,例如現在常用的ChatGPT,會有程式語言賦予的理性與客觀,比較能避免人類常見的各種偏見。