【AI 科普 02】為什麼 AI 能回覆得像這麼像一回事

更新 發佈閱讀 7 分鐘
vocus|新世代的創作平台

前言

上一篇,我們聊了 AI 的本質:它不是在思考,是在接龍。根據上下文,一個 token 一個 token 地預測下一個最可能出現的內容。

但這就帶出了一個更深的問題:如果它只是在接龍,為什麼它能接得這麼像那回事?

它能寫出邏輯通順的文章、能解數學題、能寫程式、甚至能跟你辯論哲學。一個「只是在算機率」的系統,怎麼做到這些的?

這篇,我們從一個有趣的思想實驗開始。


無限猴子定理

你可能聽過這個:

如果讓一隻猴子在打字機前隨機敲鍵盤,只要給它無限長的時間,它終究會打出一部完整的莎士比亞全集。

這就是「無限猴子定理」。聽起來荒謬,但在數學上,它是成立的——只要時間真的是無限的,任何有限長度的字串,都有機率被隨機產生出來。

當然,現實中沒有人真的會等一隻猴子敲出莎士比亞。這個定理真正想說的不是猴子有多厲害,而是一件事:當隨機嘗試的次數足夠多,看起來不可能的事情,就會變成必然。

記住這句話,因為接下來我們要把它搬到 AI 身上。


AI 跟猴子的差距在哪?

如果純粹的隨機敲鍵盤就能敲出莎士比亞,那 AI 做的事情,其實就是把這個過程大幅優化。

我們來拆解:

猴子的問題是什麼? 純隨機。每一次敲擊跟前一次完全無關。它敲出「T」之後,下一個字母是「h」的機率跟是「z」的機率一樣。所以它需要無限的時間。

AI 做了什麼不同的事? 它不是純隨機。上一篇我們講過,AI 的每一次預測都基於前面所有的上下文。它學過人類的語言模式,所以它知道「T」後面接「h」的機率遠高於接「z」。

換句話說,AI 不是用無限的時間去碰運氣,而是用訓練資料裡學到的規律,大幅縮小了每一步的可能性範圍。猴子面對的是整個鍵盤,AI 面對的是一個經過篩選的、有權重的選項清單。

我們可以這樣對照:

猴子靠無限的時間來覆蓋所有可能性。AI 用海量的訓練資料取代了那個無限時間——它不需要自己隨機碰撞,因為人類幾千年來的書面產出,已經替它把大部分的「正確組合」展示過了。

猴子只有一隻,所以需要很久。AI 有幾千億個參數同時在運作,每一個參數都在幫忙縮小選擇範圍,就像同時有幾千億隻「受過訓練的猴子」在協作。

猴子的每一次敲擊完全隨機。AI 的每一次預測都經過 attention 機制的加權——它會「看」前面的上下文,判斷哪些資訊跟當前的預測最相關,然後把注意力集中在那些地方。

猴子沒有偏好,什麼都敲。AI 經過 RLHF 調整,機率分佈已經偏向人類認為「好」的方向。

四個差異疊在一起,結果就是:猴子需要無限時間才能碰巧做到的事,AI 在幾秒內就能做到。不是因為 AI 「懂」,而是因為它面對的不再是純粹的隨機,而是一個被大幅壓縮過的機率空間。


那個「像那回事」的門檻

到這裡,我們可以回答開頭的問題了:為什麼 AI 能接得這麼像那回事?

答案是:不是因為它產生了什麼新的能力,而是它的機率覆蓋面,密集到了一個程度,讓輸出在人類的感知上跨過了「像那回事」的門檻。

你可能聽過一個詞叫「湧現(Emergence)」——當模型規模大到某個程度,突然就「會」做一些小模型做不到的事。翻譯、寫程式、邏輯推理,這些能力看起來像是在某個臨界點突然出現的。

但如果你理解了上面的猴子比喻,你會注意到另一種可能的解釋:這些能力可能不是「突然出現」的,而是一直都在那裡——只是在小模型的時候,機率覆蓋面不夠密,命中率太低,低到你不覺得它「會」。當模型變大、參數變多、訓練資料變廣,覆蓋面終於密到一個程度,命中率跨過了你的感知門檻,你就覺得它「突然會了」。

打個比方:想像你在一片空白的牆上隨機噴點。點很少的時候,你什麼都看不出來。但隨著點越來越密,某個瞬間,你突然認出了一張臉。那張臉不是在某一個點被噴上去的時候「出現」的,它是在點的密度跨過你的辨識門檻時,被你「看見」的。

AI 的湧現,或許就是這件事。不是能力的誕生,是密度的跨越。

當然,我要誠實地說:這是我個人的觀點,不是學術界的定論。關於湧現的本質,學界目前沒有共識。有些研究者認為湧現是真實的新能力出現,有些則認為是測量方式的問題。我傾向用上面的方式理解它,但你可以有自己的判斷。


當機率覆蓋不到的時候

理解了這個邏輯,你就能理解 AI 為什麼會「出錯」。

如果 AI 的能力來自機率覆蓋面的密度,那麼在覆蓋面稀疏的地方,它就會不可靠。

想像 AI 的知識像一張地圖。訓練資料多的領域,地圖畫得很細緻——每條路、每棟建築都標得清清楚楚。訓練資料少的領域,地圖就很粗糙——只有大概的輪廓,細節是模糊的。

當你問 AI 一個常見問題,它等於是在地圖細緻的區域導航,答得又快又準。但當你問一個冷門問題、或者一個需要跨領域組合的問題,它就進入了地圖模糊的區域。

這時候會發生什麼?它不會停下來說「我不知道」。記得嗎——它是接龍。它的任務是預測下一個最可能的 token。即使在模糊的區域,它還是會選一個機率最高的選項輸出。

問題是,在模糊區域裡,「機率最高」不代表「正確」。它可能會把不同領域的資訊混在一起,產生一個看起來合理但實際上不存在的答案。這就是人們常說的「幻覺(Hallucination)」。

它不是在「編造」——它沒有編造的意圖。它只是在機率覆蓋不夠密的地方,依然按照同樣的機制在運作。在密的地方,這個機制產出正確答案;在疏的地方,同樣的機制產出錯誤答案。機制沒變,變的是地圖的精度。


結語

回到最初的問題:AI 為什麼能接得這麼像那回事?

不是因為它理解了什麼,是因為它用海量的訓練資料、幾千億個參數、attention 機制的聚焦、RLHF 的偏好調整,把猴子的純隨機壓縮成了高度集中的機率預測。當這個預測的覆蓋面密到一定程度,人類就覺得它「會」了。

而當覆蓋面不夠密的時候,同樣的機制就會產生幻覺——不是因為它「想騙你」,是因為它在地圖模糊的地方,還是按同樣的方式在走路。

知道了這個,你就能更清楚地判斷:AI 在什麼領域可靠、什麼領域該保持警覺。地圖越詳細的地方越可信,越模糊的地方越需要你自己把關。

下一篇,我們來聊聊另一個你可能在意的問題——AI 的行為,為什麼有時候會「不受控」?

留言
avatar-img
Joe 的隨手筆記
2會員
12內容數
用自己的方式,探討自己觀察到的事物。
Joe 的隨手筆記的其他內容
2026/04/13
本文探討權力的演變,從原始社會因「製造更好」而獲得影響力,演變成現代社會因「掌握更多」而維持權力。文章分析了社會複雜化、因果鏈斷裂導致的權力轉移,以及結構性因素如何使「製造更好」變得更為困難,並解釋了為何許多無效政策和現象得以持續。
Thumbnail
2026/04/13
本文探討權力的演變,從原始社會因「製造更好」而獲得影響力,演變成現代社會因「掌握更多」而維持權力。文章分析了社會複雜化、因果鏈斷裂導致的權力轉移,以及結構性因素如何使「製造更好」變得更為困難,並解釋了為何許多無效政策和現象得以持續。
Thumbnail
2026/04/11
印度與阿聯酋等國已禁用 SMS OTP。本文深入探討 SMS OTP 的核心問題,指出其根本缺陷在於「無 origin binding」的設計,易受釣魚攻擊,而非技術攔截。文章比較了 Passkey 的優劣與現實阻力,並提出一個無需改變用戶習慣的協議層解決方案,同時分析了推動此方案所面臨的利益格局。
Thumbnail
2026/04/11
印度與阿聯酋等國已禁用 SMS OTP。本文深入探討 SMS OTP 的核心問題,指出其根本缺陷在於「無 origin binding」的設計,易受釣魚攻擊,而非技術攔截。文章比較了 Passkey 的優劣與現實阻力,並提出一個無需改變用戶習慣的協議層解決方案,同時分析了推動此方案所面臨的利益格局。
Thumbnail
2026/04/05
本文記錄了作者透過小型模型實驗驗證 M = i × e 公式,儘管實驗初期遭遇困難,透過 AI 回饋修正框架設計,最終在有限數據量下取得預期外的成效。然而,作者對驗證的有效性與改善的根本原因產生了兩大困惑,並在權衡投入產出比後暫停深入探究,轉而思考 AI 的數學運算可能性。
Thumbnail
2026/04/05
本文記錄了作者透過小型模型實驗驗證 M = i × e 公式,儘管實驗初期遭遇困難,透過 AI 回饋修正框架設計,最終在有限數據量下取得預期外的成效。然而,作者對驗證的有效性與改善的根本原因產生了兩大困惑,並在權衡投入產出比後暫停深入探究,轉而思考 AI 的數學運算可能性。
Thumbnail
看更多
你可能也想看
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
本指南提供100個AI驅動的指令,涵蓋SEO關鍵詞研究、內容生成、數據分析、多平臺適配及用戶意圖解析,旨在協助營銷人員、內容創作者與SEO專家提升工作效率與成效。指令分為五大類別,並附帶實際應用範例及工具建議,
Thumbnail
本指南提供100個AI驅動的指令,涵蓋SEO關鍵詞研究、內容生成、數據分析、多平臺適配及用戶意圖解析,旨在協助營銷人員、內容創作者與SEO專家提升工作效率與成效。指令分為五大類別,並附帶實際應用範例及工具建議,
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
內容不是產出,而是長期滾動的數位資產 「為什麼我這麼努力,存款還是只有五位數?」 這是林先生連續第三年在年終檢視財務狀況時,內心最大的疑問。身為台北某科技公司的資深專員,月薪5萬5,看似不差,但扣掉房租1萬8、生活費、孝親費,每個月能存下來的不到1萬5。按照這個速度,光是頭期款就要存10年。
Thumbnail
內容不是產出,而是長期滾動的數位資產 「為什麼我這麼努力,存款還是只有五位數?」 這是林先生連續第三年在年終檢視財務狀況時,內心最大的疑問。身為台北某科技公司的資深專員,月薪5萬5,看似不差,但扣掉房租1萬8、生活費、孝親費,每個月能存下來的不到1萬5。按照這個速度,光是頭期款就要存10年。
Thumbnail
本文是軟式生活2026 年 SEO 完整指南:掌握 SEO、AEO、GEO 三大策略。Google AI Overviews 出現在 50% 搜尋結果,學習 E-E-A-T 信號、FAQ Schema 實施教學,讓 AI 引用你的內容,包含數據增加 22% 可見性,跨平台策略提升 2.8 倍引用率。
Thumbnail
本文是軟式生活2026 年 SEO 完整指南:掌握 SEO、AEO、GEO 三大策略。Google AI Overviews 出現在 50% 搜尋結果,學習 E-E-A-T 信號、FAQ Schema 實施教學,讓 AI 引用你的內容,包含數據增加 22% 可見性,跨平台策略提升 2.8 倍引用率。
Thumbnail
許多使用者發現 AI 內容生成效果不如預期,本文深入剖析常見的 AI 提示詞問題,並提供十個錯誤示範與修正版的對比,強調「替特定讀者設計」與「釐清 AI 角色」是提升生成品質的核心觀念。
Thumbnail
許多使用者發現 AI 內容生成效果不如預期,本文深入剖析常見的 AI 提示詞問題,並提供十個錯誤示範與修正版的對比,強調「替特定讀者設計」與「釐清 AI 角色」是提升生成品質的核心觀念。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News