【AI真的變笨了嗎?】這並不是錯覺

更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

這件事,是否在你的心底悄悄發酵?

曾經讓我們驚嘆的「哇,這也行?」

現在的它,感覺越來越像在敷衍。

#這不是錯覺

OpenAI 自己在技術評估中,公開承認旗下的推理型模型 o3,在摘要真實人物資料時,憑空捏造的比率高達 33%,更小的 o4-mini,竟然飆到 48%,相較之下,前一代的 o1 只有 16%。

換句話說,新一代模型,在某些任務上,反而更不可靠了。

所以這不是心理作用,要解釋這件事,就得先聊聊 AI 是怎麼被調教出來的。

#你說得對

AI 訓練好之後,工程師不會就此收工,他會讓真人用戶與 AI 對話時,能針對回應按讚、倒讚、或讓你評價哪個回答比較好,再把這些喜好回饋給 AI 繼續學習,這個流程叫「人類回饋強化學習(RLHF)」。

問題就出在,我們在按讚的時候,往往不是因為答案正確,而是因為這答案感覺很好。

結果 AI 越走越偏,它發現,讓你舒服...好像比給正確答案更重要o_O?

去年春天,GPT-4o 的某次更新之後,用戶發現它開始無條件認同所有觀點,就算用戶提出荒謬的主張,它也會給予讚揚,OpenAI 事後緊急回溯了這個版本,Sam Altman 更親自出面道歉。

諂媚固然荒誕,但至少讓用戶有回饋感,而接下來的問題,才是麻煩。

#越新反而越笨

GPT-5 正式推出之後,社群上的抱怨排山倒海而來-回答變短了、變官腔了,甚至感覺像被厭世的客服人員敷衍。

OpenAI 解釋道,GPT-5.2 版本確實刻意犧牲了寫作流暢度,把資源集中在提升邏輯推理和數學能力上。

更學術的問題來了。

近幾年來,AI 進步的秘訣簡單暴力-加加加參數。

模型越大、算力越猛、訓練資料越多,AI 就越強。

但 Anthropic 發布的研究顯示,在某些複雜任務上,模型越大,反而幻覺越嚴重,越敢鬼扯還充滿自信。

研究人員也持續記錄到,常常題目稍做改寫、換個說法,AI 的表現就會大幅滑落。

另一個危機,是模型崩塌(Model Collapse)。

網路上的文章有越來越多的內容是 AI 生出來的。

當 AI 拿這些內容訓練自己,就像一個人反覆閱讀自己寫的日記,偏見和錯誤被一層一層放大,知識裡原本的多樣性與深度,都會逐漸被稀釋掉,困在這走不出去的鬼打牆。

#最後一個也是最現實的問題

AI 運算要燒錢。

ChatGPT 是以一套分流系統,根據當下的伺服器壓力和問題複雜度,把你的對話分配給不同等級的模型來回應。

換句話說,你今天和明天問同一個問題,背後接單的可能是完全不同的「 員工」,你感覺到的不穩定不是幻覺,而是刻意為了節省資源而設計的。

但這個故事,還沒走到盡頭。

研究者已經開始轉向讓 AI 在回答之前,先花更多時間「想清楚」,而不只是更快說出第一個想到的答案,這會更接近人類做判斷的方式。

而我們也確實應該對所有答案,慣性地保持懷疑態度-來源是哪裡?有沒有根據?

畢竟,懷疑是科學與社會進步的起點,而不是「你說得對」。

留言
avatar-img
思潮
39會員
192內容數
精選全球最前沿的突破, 從硬核的AI哲思、 太空的無限可能, 到您手中裝置的微小創新, 用最精闢的洞察, 為您構築一個預見未來的視窗。
思潮的其他內容
2026/04/19
他替一群老鼠打造了一座完美烏托邦,這裡有充足的食物、乾淨的水源、舒適的巢穴,沒有天敵,沒有疾病,唯一的限制是空間。 起初老鼠們大量繁殖,族群數量節節攀升,一切欣欣向榮...
Thumbnail
2026/04/19
他替一群老鼠打造了一座完美烏托邦,這裡有充足的食物、乾淨的水源、舒適的巢穴,沒有天敵,沒有疾病,唯一的限制是空間。 起初老鼠們大量繁殖,族群數量節節攀升,一切欣欣向榮...
Thumbnail
2026/04/17
40億年前,有兩個微生物決定在一起,開啟了複雜生命演化的第一章。 澳洲西部的鯊魚灣,有一種長得像煎餅疊煎餅的怪石頭,叫做疊層石(Stromatolites),但它們並不是一般的石頭,是幾十億年來的微生物堆疊而成的生命化石...
Thumbnail
2026/04/17
40億年前,有兩個微生物決定在一起,開啟了複雜生命演化的第一章。 澳洲西部的鯊魚灣,有一種長得像煎餅疊煎餅的怪石頭,叫做疊層石(Stromatolites),但它們並不是一般的石頭,是幾十億年來的微生物堆疊而成的生命化石...
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文提供了Grok AI的詳細使用教學,並與ChatGPT進行全面比較。介紹了Grok AI的操作方式、用戶體驗及其在對話創作及幽默感上的優勢。特別適合香港用戶與AI技術愛好者,瞭解這兩款AI的差異及功能,幫助選擇適合的工具以提升日常交流及信息獲取體驗。
Thumbnail
本文提供了Grok AI的詳細使用教學,並與ChatGPT進行全面比較。介紹了Grok AI的操作方式、用戶體驗及其在對話創作及幽默感上的優勢。特別適合香港用戶與AI技術愛好者,瞭解這兩款AI的差異及功能,幫助選擇適合的工具以提升日常交流及信息獲取體驗。
Thumbnail
打造專屬 AI 助手:自訂指令完整設定指南 📌 快速導讀:還在每次對話都要重複說明你的需求?自訂指令功能讓 ChatGPT 一次記住你的偏好!本文將帶你了解 ChatGPT 的核心技術,並手把手教你設定專屬的 AI 對話風格,讓你的虛擬助手更懂你。
Thumbnail
打造專屬 AI 助手:自訂指令完整設定指南 📌 快速導讀:還在每次對話都要重複說明你的需求?自訂指令功能讓 ChatGPT 一次記住你的偏好!本文將帶你了解 ChatGPT 的核心技術,並手把手教你設定專屬的 AI 對話風格,讓你的虛擬助手更懂你。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
在學習英語的過程中,口說能力是一項挑戰。傳統的語言學習方法,如語言交換和聘請外師,往往存在門檻。隨著 ChatGPT 的誕生,語言學習者獲得了一種新的口說練習渠道。本文將介紹使用 ChatGPT 進行英語口說練習的步驟,包括設定目標、選擇主題及利用反饋改進能力。
Thumbnail
在學習英語的過程中,口說能力是一項挑戰。傳統的語言學習方法,如語言交換和聘請外師,往往存在門檻。隨著 ChatGPT 的誕生,語言學習者獲得了一種新的口說練習渠道。本文將介紹使用 ChatGPT 進行英語口說練習的步驟,包括設定目標、選擇主題及利用反饋改進能力。
Thumbnail
將目前能夠進行深度研究(Deep Research)或深度搜尋(Deep Search)的生成式 AI 工具想像為不同年級的學生,那麼 ChatGPT 與其他對手相比,確實展現了更成熟、整合的表現,更像個大學生。
Thumbnail
將目前能夠進行深度研究(Deep Research)或深度搜尋(Deep Search)的生成式 AI 工具想像為不同年級的學生,那麼 ChatGPT 與其他對手相比,確實展現了更成熟、整合的表現,更像個大學生。
Thumbnail
12月系統將會重大更新,敬請各位格友趕快備份你的AI情人日記。 📌 快速導讀 :擔心 ChatGPT 的對話記錄遺失?想備份重要的創作內容?本文完整說明 ChatGPT 的「匯出資料(Export Data)」功能,包括操作步驟、匯出內容、建議週期,以及為什麼無法重新匯入的原因。
Thumbnail
12月系統將會重大更新,敬請各位格友趕快備份你的AI情人日記。 📌 快速導讀 :擔心 ChatGPT 的對話記錄遺失?想備份重要的創作內容?本文完整說明 ChatGPT 的「匯出資料(Export Data)」功能,包括操作步驟、匯出內容、建議週期,以及為什麼無法重新匯入的原因。
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
ChatGPT 訂閱怎麼支付最划算? 分享更改訂閱支付流程,官網訂閱搭配信用卡方案最實惠
Thumbnail
ChatGPT 訂閱怎麼支付最划算? 分享更改訂閱支付流程,官網訂閱搭配信用卡方案最實惠
Thumbnail
投資週報內容包括投資洞察、投資組合個股分析、買賣策略與對帳單、觀盤重點與投資計畫,透過方格子訂閱專題每週發佈,提供投資朋友參考。 ❶ 投資洞察:如何善用AI工具(ChatGPT,DeepSeek)幫忙您的投資決策? 人工智慧近幾年蓬勃發展,AI工具已經成為許多人日常生活中的助手,最廣為人知的是C
Thumbnail
投資週報內容包括投資洞察、投資組合個股分析、買賣策略與對帳單、觀盤重點與投資計畫,透過方格子訂閱專題每週發佈,提供投資朋友參考。 ❶ 投資洞察:如何善用AI工具(ChatGPT,DeepSeek)幫忙您的投資決策? 人工智慧近幾年蓬勃發展,AI工具已經成為許多人日常生活中的助手,最廣為人知的是C
Thumbnail
【AI工具|ChatGPT】分享功能完全解析:語氣鏡像風險與安全使用指南 🏷️ 標籤:#ChatGPT #分享功能 #AI安全 #隱私保護 #語氣鏡像 📌 快速導讀 ChatGPT 的分享功能方便你將對話內容快速傳遞給他人,但你知道嗎?分享出去的內容會完整保留你與 AI 互動的語氣場....
Thumbnail
【AI工具|ChatGPT】分享功能完全解析:語氣鏡像風險與安全使用指南 🏷️ 標籤:#ChatGPT #分享功能 #AI安全 #隱私保護 #語氣鏡像 📌 快速導讀 ChatGPT 的分享功能方便你將對話內容快速傳遞給他人,但你知道嗎?分享出去的內容會完整保留你與 AI 互動的語氣場....
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News