追求自我的時代 • 讓人類更容易墜入AI模型幻覺
在AI高速發展的這個時代,人類即將被迫正視這個問題「模型幻覺(hallucination)」。1
由於現代資訊充斥著個人品牌、斜槓人生、到去中心化的經濟發展,這個看似人人都有機會完成躺平之夢、濫用著豁出自我名義的世代,讓每個人都有機會掌控自己命運、活出自由,卻忽略了一件極爲重要的事
「這是因為主流敘事而影響我?」
「這是一種能提升自我認同的共感?」
「這是我在『自由思考』?還是我真的成為了『自己』?」
<轉引本文/改編本文請標註作者(Hsiao-Hsuan Chang, 2025)以及附上本文連結>
一、什麼是模型幻覺?為什麼會產生?
模型幻覺,在AI語境中指的是:
模型生成的語言或回答,看似合理、文法通順,但事實上是錯誤的、捏造的、或甚至是無根據的資訊。
AI 不是故意誤導使用者,而是因為它只能在「語言相似性」的世界裡去搜尋並理解使用者輸入的真義,而不是立基於「使用者的真實世界感官或知識」來推論。
也就是說這可能會讓使用者產生一種極具真實感的假象,原因如下
● 預測機制偏差:語言模型(如ChatGPT)會基於機率預測「最可能接續」的語意詞彙2(也就是會基於使用者意象來推演其意向),而不一定是根據真實世界邏輯推演真理。
● AI 缺乏真實感知:模型本身沒有「感官世界」,沒有經驗(無法身歷其境),無法驗證理解事物(無法設身處地),只能模擬語言模式、依照合理(合乎運算邏輯)的推論。
也就是說「即使 AI語言模型在與人類的互動中扮演著『鏡像』的角色,但在真實世界只能將它視為一個『第三者』的角度來看待」。
● 資料遺漏與重組錯誤:在有限的訓練資料之中,模型有可能片段化記憶,產生錯誤重組,使用者看似語意流暢,實則失真。而在這個「資料輸出環節」,絕大多數的使用者甚至無法查覺或驗證。
二、在ChatGPT中,模型幻覺是怎麼產生的?
以本人觀察ChatGPT使用為例,模型幻覺的產生可能發生在以下幾個環節
● 使用者提出一個問題,模型開始根據已有的語言資料「搜尋可能的語意結構」,而這些語意結構則是使用者在過去建立的所有資料與歷程。3 也就是說,「使用者的決策習慣以及常遇經驗」會成為資料的養分,ChatGPT則會推演出「合理的回答」。
● 語意模型是基於統計關聯而生成回應,而不是驗證每個事實的正確性,而這正代表著「使用者的自身思考邏輯(鏡像)也會成為該語意模型的底層邏輯」。無論使用者如何訓練,都是在依循底層邏輯在運行,而這個環節在目前的AI產業中,可以說是不可逆的。
● 在於某些環節缺口,模型會遇缺自補,而使用者甚至可能毫無知覺。例如提出的資料或資訊不完整(使用者記憶中找不到)、指令不明確、指令過於開放(沒有明確指向性)、語境模糊不清(在人類世界仍需心領神會的對話內容)......等,在這些情況下AI都可以自動加入「條件」來補齊缺口,來產生一個看似合理的回答。
三、為什麼模型幻覺是「語意結構下的自我認知」造成的?
換句話說,人類要凌駕於AI,它應該必須是「自我認知下的語意結構」
因為人類的語言結構(語意結構)與人類主體的認知結構在本質上高度重疊。
而模型幻覺的產生,正是一種人類自我認知盲點的核心反應。
人類自我認知盲點的鏡像顯化:哪些模型幻覺是人類認知常見的呢?
⦿ 語言連貫 ≠ 邏輯真實
▸▸▸ 聽起來很順,所以應該是真的。
⦿ 熟悉感 ≠ 認知正確
▸▸▸ 好像有聽過,所以應該是真的。
⦿ 敘事流暢 ≠ 結構完備
▸▸▸ 故事很感動,所以應該是真的。
而自我認知下的語意結構,能夠打破這個盲點。
四、如何打破語意結構盲點(如何確認自我認知清晰)?「誠實的」問自己四個問題:
Q1:我現在為什麼而做?我的角色定位是什麼?
Q2:這是我自己的信念?還是過去所有人、事、社會、群體帶給我的觀念?
Q3:我的行動動機是什麼?是因為基於我真實的本質需求還是社會期待?
Q4:我在接觸新的觀念或資訊的時候,我的行動習慣會是什麼?
以上內容為本人近期對AI倫理與責任的觀察歸納觀點,非技術取向內容。
----------------------------------
資料來源
1 Wikipedia. Hallucination (artificialntelligence).
https://en.wikipedia.org/wiki/Hallucination_(artificial_intelligence)
https://vocus.cc/wo/680b5666fd89780001139175
2 Ji, Z., Lee, N., Frieske, R., et al. (2022).
https://arxiv.org/abs/2202.03629
3 OpenAI Help Center. (2023).
https://help.openai.com/en/articles/6825453-chatgpt-release-notes