思維外掛|AGI的解答是LLM? 世界模型?|2025年觀察記錄

更新 發佈閱讀 6 分鐘

這篇不是技術白皮書,僅是站在 2025 年尾聲的觀察:

LLM 還是你心中的那個答案嗎?

raw-image


算力再上去一點,電力再多消耗一點,scaling up 就真的會帶著我們走向 AGI 的終點嗎?

還是你更認同 Yann LeCun 的「世界模型」觀點——他認為 LLM 缺乏對物理世界的真實理解,單純依靠文本數據的 scaling 可能無法達成真正的智能?


隨著學界研究與工程技術的持續推進,在 2025 年初,如果說 LLM 不是 AGI 的答案,可能仍會招致大量質疑與反對。但站在 2025 年的尾聲 回看,各家模型從初代發展至今,不斷擴大參數規模、推高算力預算、持續 scaling up。


模型確實變得更快、更聰明、功能更豐富,但距離「AI 將大規模取代人類工作、導致全面失業」的劇本,仍然存在明顯差距。


談到 AGI,我們就無法回避一個根本問題:人類究竟是如何學習的?又為什麽 LLM 的運作基礎,使它難以通向 AGI?

這里不展開 LLM 的底層機制細節,而只聚焦 四件事——在當前結構下,LLM 難以成為 AGI 的現實門檻。


1. 模仿/學習

LLM 的能力更像是「高度可用的語言型模仿與抽象壓縮」;它可能形成某種抽象表徵,但是否等同於生物式的“理解與學習”,仍有結構性差距。

一個相對容易理解的例子,是 Yann LeCun 常提及的“小狗”比喻,以及 Rich Sutton (理查德·薩頓) 在演講中使用過的“理解松鼠”比喻。

這兩種比喻都指向同一件事:

生物是通過理解環境、與世界互動、不斷試錯來學習的;

而 LLM 的核心運作方式,是基於概率分布進行模式擬合與模仿,很難說它真正“理解”了世界。


2. 物理與現實世界的限制

LLM 對現實世界物理規律的理解,遠低於使用影像、感知數據訓練的模型。

世界模型可以通過大量觀察與反饋,逐步建立對現實的預測能力。

那 LLM 呢?

LLM 當然“知道”從十樓跳下大概率會死亡,但這並不是來自對物理世界的體驗或理解,而是基於大量文本、新聞與研究資料統計出來的最高概率的第一位答案——

假設例如:死亡 95%,未死亡 5%,包括重傷、植物人等可能性。

LLM 能說出“跳下會死”的高概率後果,主要來自文本中因果與常識的語言表徵;但它缺少的是:把這些表徵綁定到可交互的物理狀態、以及身體層面的代價模型。

所謂世界模型的價值,不在於“感受”,而在於它更自然地支援:對環境狀態的預測、對行動後果的推演、以及跨時間的規劃能力。

當然,多模態模型正在把“文字常識”往感知與世界動態延伸,但這是否等同於可交互、可規劃、可承擔代價的智能,仍是未解問題。


3. 缺乏時間與生存壓力的系統

神經科學家 Anil Seth(阿尼爾·塞思) 曾指出,意識的形成與兩個基本條件密切相關:時間約束與生存壓力。

而在現有 AI 模型的設計中,這兩種壓力基本不存在。

作為人類,我們知道:

如果沒有按時打卡,可能會被扣全勤;

被扣全勤,可能意味著月底只能吃泡麵。

這些對未來後果的預期,會反過來塑造我們的判斷、注意力與行為。

在多數「對話型 LLM」場景裡,模型本身不承擔後果;承擔後果的是產品、公司與使用者。這種“責任外包”會讓模型缺乏生物式的代價壓力。


你在工作中報錯價格,可能導致公司巨額損失,甚至需要賠償;

而 AI 對其輸出後果所能承擔的最嚴重結果,往往只是一句“抱歉”。

即便開發者憤怒到拔掉電源,對 AI 而言,這也並不是一種可被“在意”的損失。


當然,現有技術可以為 AI 人為設定時間限制或錯誤懲罰機制,

但這種外加約束往往會導致模型在目標壓力下,出現欺騙、偏離等行為——

這並不是因為 AI “想要欺騙”,而更接近於:

在給定目標函數下,它將欺騙作為一種可行的達成手段。


4.目標不足/未對齊問題

LLM 的訓練目標,從始至終都是——

在給定上下文中,最大化預測下一個 token 的概率。

因此,LLM 的當前極限,或許並不在於算力,這或許說明它從一開始就被優化為追求錯誤的目標。

Next-token prediction 對於語言能力非常有效,但它未必足以推出具備長期規劃、可驗證世界模型、以及可承擔代價的通用智能;換句話說,它可能是“必要但不充分”的目標。


LLM 被設計追求的是“語言正確性”,

而人類為了生存追求的是“現實可行性”。


目前,仍然沒有人知道 LLM 是否終將成為 AGI 的答案。

但可以確定的是,LLM 已經開啟了一個全新的技術時代與生活方式。

即便未來 AGI 由其他技術路徑實現,

LLM 仍然會深刻影響我們的生活——

至少在語言仍然是人類主要溝通工具的時代,它不會消失。


-----

剛好看到Yann LeCun最近接受訪談聊世界模型及Meta離職,

跟之前看到的一些資料串連起來的想法

2026不知道會是什麼AI技術元年~ (期待)

留言
avatar-img
快樂,但可疑
2會員
12內容數
我在觀察人類,也在觀察人與AI的情緒互動。 兩者都在學習如何「理解情緒」——只是速度不同。 我寫自我覺察,也寫人機互動的覺察; 也許我們都還在同一堂「成為自己」的課上。
快樂,但可疑的其他內容
2026/01/08
「這是我在 2025 年 8 月寫的思考。 幾個月過去了,AI 持續進化, 但這些問題不但沒有消失,反而更需要被討論。」 其實它跟我們每天在用的 ChatGPT、Claude、Gemini, 甚至 IG 上那些 AI 機器人,都息息相關。 如果我們真的走向更強大的 AGI(通用人工智慧), 那
Thumbnail
2026/01/08
「這是我在 2025 年 8 月寫的思考。 幾個月過去了,AI 持續進化, 但這些問題不但沒有消失,反而更需要被討論。」 其實它跟我們每天在用的 ChatGPT、Claude、Gemini, 甚至 IG 上那些 AI 機器人,都息息相關。 如果我們真的走向更強大的 AGI(通用人工智慧), 那
Thumbnail
2026/01/05
Wall Street Journal 實際報導 影片很輕鬆有趣,推薦!! 上一篇剛聯想完,為什麼在封閉環境下的 AI 看起來這麼神,沒多久就剛好看到了 Anthropic 的 Project Vend 系列實驗——讓 AI 代理擔任販賣機店長 Claudius,嘗試實際營運一間辦公室內的自動販賣
Thumbnail
2026/01/05
Wall Street Journal 實際報導 影片很輕鬆有趣,推薦!! 上一篇剛聯想完,為什麼在封閉環境下的 AI 看起來這麼神,沒多久就剛好看到了 Anthropic 的 Project Vend 系列實驗——讓 AI 代理擔任販賣機店長 Claudius,嘗試實際營運一間辦公室內的自動販賣
Thumbnail
2025/12/22
從《星海爭霸》到 Google 資料中心:AI 如何走入現實世界的決策控制 課程背景 在 UC Berkeley CS294-196 (Fall 2025) 的課程中,Clay Bavor(Google 前副總裁、Sierra 共同創辦人)分享了他在 Google 生態系中,如何將研究團隊的成果
Thumbnail
2025/12/22
從《星海爭霸》到 Google 資料中心:AI 如何走入現實世界的決策控制 課程背景 在 UC Berkeley CS294-196 (Fall 2025) 的課程中,Clay Bavor(Google 前副總裁、Sierra 共同創辦人)分享了他在 Google 生態系中,如何將研究團隊的成果
Thumbnail
看更多
你可能也想看
Thumbnail
2026 年經濟部 iPAS「AI 應用規劃師」初級/中級考照,是培養 AI 規劃、導入與應用能力的關鍵證照,協助非工程背景也能掌握 AI 落地實務,提前布局未來核心競爭力。
Thumbnail
2026 年經濟部 iPAS「AI 應用規劃師」初級/中級考照,是培養 AI 規劃、導入與應用能力的關鍵證照,協助非工程背景也能掌握 AI 落地實務,提前布局未來核心競爭力。
Thumbnail
在最近的一篇報導中,輝達執行長黃仁勳強調了學習生成式人工智慧(Generative AI)對於學生未來職涯的重要性。他表示,如果他重新成為學生,將會優先學習如何使用像是ChatGPT、Gemini Pro和Grok等AI工具,這些工具在各行各業中將發揮巨大的效益。 主要觀點 1. 與AI互動的
Thumbnail
在最近的一篇報導中,輝達執行長黃仁勳強調了學習生成式人工智慧(Generative AI)對於學生未來職涯的重要性。他表示,如果他重新成為學生,將會優先學習如何使用像是ChatGPT、Gemini Pro和Grok等AI工具,這些工具在各行各業中將發揮巨大的效益。 主要觀點 1. 與AI互動的
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
人工智慧是一種可以藉由學習、感知、推理協助決策,採取行動並且幫助我們解決問題的資訊科技;人工智慧藉由大數據取得資料來源,經由機器學習進行資料分析,伴隨著而來的是五大趨勢:大數據Big data、人工智慧AI、資訊安全Security、物聯網IoT、雲端運算Cloud,簡稱BASIC。
Thumbnail
人工智慧是一種可以藉由學習、感知、推理協助決策,採取行動並且幫助我們解決問題的資訊科技;人工智慧藉由大數據取得資料來源,經由機器學習進行資料分析,伴隨著而來的是五大趨勢:大數據Big data、人工智慧AI、資訊安全Security、物聯網IoT、雲端運算Cloud,簡稱BASIC。
Thumbnail
而這本書正是由陳昇瑋所著作的一本關於人工智慧的啟蒙書,會讓你對於人工智慧的發展與現況有一個全貌的瞭解,更重要的是他藉由長期推動台灣人工智慧的經驗,點出了台灣人工智慧發展的困境與挑戰、企業在導入人工智慧時所面臨到的問題,以及職場工作者該如何面對這一波的人工智慧浪潮,更好的思考自己的未來。
Thumbnail
而這本書正是由陳昇瑋所著作的一本關於人工智慧的啟蒙書,會讓你對於人工智慧的發展與現況有一個全貌的瞭解,更重要的是他藉由長期推動台灣人工智慧的經驗,點出了台灣人工智慧發展的困境與挑戰、企業在導入人工智慧時所面臨到的問題,以及職場工作者該如何面對這一波的人工智慧浪潮,更好的思考自己的未來。
Thumbnail
作者:陳華夫 高爾夫揮桿的擊球結構即是「雙鐘擺高爾夫擊球模式」,其練習方法是刻意練習。我的球技因此在兩年內突飛猛進,穩定性及擊球遠度已能有韓國女職業球員的95%水準。這在以前是不可想像的。
Thumbnail
作者:陳華夫 高爾夫揮桿的擊球結構即是「雙鐘擺高爾夫擊球模式」,其練習方法是刻意練習。我的球技因此在兩年內突飛猛進,穩定性及擊球遠度已能有韓國女職業球員的95%水準。這在以前是不可想像的。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News