vocus logo

方格子 vocus

LLM 是「記憶」或「推理」?

更新 發佈閱讀 5 分鐘

大型語言模型(LLM)到底是在「理解」,還是在「記憶」訓練資料?

很多研究(例如來自 Stanford University、OpenAI、Google DeepMind)發現:

LLM 同時包含「記憶」與「推理」,而且比例會隨資料與模型大小改變。

下面用比較直觀的方式說明。


一、LLM 的兩種能力

LLM 的能力大致可以分成兩類:

vocus|新世代的創作平台

例子:

記憶

模型背過:

</>Plain text
巴黎是法國首都

所以回答:

</>Plain text
法國首都 → 巴黎

推理

模型從很多例子學到規則:

</>Plain text
AB 的首都

所以可以回答新問題:

</>Plain text
義大利首都 → 羅馬

二、研究發現:模型確實會記憶資料

很多實驗證明 LLM 會逐字記住部分訓練資料

研究人員做過一個實驗:

1️⃣ 在訓練資料放入一段隨機文字

</>Plain text
qzrxmptv 9173 aklsd

2️⃣ 訓練模型

3️⃣ 問模型:

</>Plain text
qzrxmptv 後面是什麼

模型會回答:

</>Plain text
9173 aklsd

代表模型 真的記住了文本


三、為什麼模型會記住資料

原因來自神經網路的本質。

訓練過程:

</>Plain text
資料 → loss → gradient → 更新參數

如果某段資料:

  • 出現很多次
  • 結構固定

模型就會直接把它編碼進權重


四、模型容量越大,記憶越多

研究發現:

vocus|新世代的創作平台

例如:

</>Plain text
7B 模型 → 偏泛化175B 模型 → 可記憶大量文本

因為參數量巨大。


五、memorization 的量有多大

有研究估算:

大型模型可能記住:

</>Plain text
1%5%

的訓練資料。

但注意:

</>Plain text
訓練資料通常是 TB

所以記住的文本仍然非常多。


六、memorization 不一定是壞事

其實記憶是必要的。

例如:

知識

</>Plain text
元素週期表歷史事件法律條文

如果不記憶:

模型就無法回答。


七、真正問題是「過度記憶」

如果模型:

</>Plain text
直接複製訓練資料

就會出現問題:

1️⃣ 版權問題

2️⃣ 隱私洩漏

例如:

有人曾讓模型輸出:

</>Plain text
訓練資料中的 email

這就是研究界很關注的問題。


八、memorization vs reasoning 的測試

研究者常用幾種方法測試。

方法 1:改寫問題

例如:

訓練資料:

</>Plain text
安史之亂發生於755

測試:

</>Plain text
唐朝哪一年爆發安史之亂?

如果模型能回答:

</>Plain text
755

代表它有一定理解。


方法 2:counterfactual

把事實改掉:

</>Plain text
假設安史之亂發生於760

看模型能否推理。


方法 3:完全新問題

例如:

</>Plain text
新發明的邏輯問題

看模型能否解。


九、研究結論:LLM 是混合系統

目前共識是:

</>Plain text
LLM = 記憶 + 模式學習 + 推理

比例取決於:

vocus|新世代的創作平台

十、RAG 其實是為了解決這問題

RAG 的想法是:

</>Plain text
不要讓模型記住所有知識

而是:

</>Plain text
需要時再查

所以現在很多系統:

</>Plain text
LLM → 推理RAG → 記憶

十一、哲學層面的問題

這也引出一個著名思想實驗:

Chinese Room(中文房間)

提出者:

John Searle

核心問題:

</>Plain text
如果一個系統只是依規則操作符號它算理解語言嗎?

很多人認為:

LLM 很像這個系統。


十二、最新研究方向

現在 AI 研究的熱門方向包括:

1️⃣ mechanistic interpretability

研究模型內部神經元在做什麼

2️⃣ reasoning models

強化推理能力

3️⃣ memory architectures

外部記憶系統


總結

LLM 的能力其實是:

</>Plain text
部分記憶+ 模式學習+ 推理

而不是單純的理解或背誦。





留言
avatar-img
sirius數字沙龍
23會員
518內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/08
這是很多最新大模型的核心技術,用直觀 + 技術結構解釋目前很多大型模型使用的架構:Mixture of Experts(MoE)。這種架構讓模型可以做到超大參數量,但推理成本卻沒有等比例增加。 一、什麼是 Mixture of Experts(MoE)
Thumbnail
2026/03/08
這是很多最新大模型的核心技術,用直觀 + 技術結構解釋目前很多大型模型使用的架構:Mixture of Experts(MoE)。這種架構讓模型可以做到超大參數量,但推理成本卻沒有等比例增加。 一、什麼是 Mixture of Experts(MoE)
Thumbnail
2026/03/07
現在 AI 公司最常用的 dataset 技術: 「RAG + 微調」混合架構 它能讓小模型能力 提升 5~20 倍。 目前 AI 系統非常主流的一種架構:RAG + 微調(Fine-tuning)混合架構。很多公司都使用這種方法來打造專業 AI 助手,因為它能讓模型既有知識又能查最新資料。
Thumbnail
2026/03/07
現在 AI 公司最常用的 dataset 技術: 「RAG + 微調」混合架構 它能讓小模型能力 提升 5~20 倍。 目前 AI 系統非常主流的一種架構:RAG + 微調(Fine-tuning)混合架構。很多公司都使用這種方法來打造專業 AI 助手,因為它能讓模型既有知識又能查最新資料。
Thumbnail
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
看更多
你可能也想看
Thumbnail
今年的國泰金控技術年會,關於 AI 有幾個主題覺得很有趣、也受到一些啟發: 1. 可解釋 AI : AI 的可解釋性一直是一個很被關注的題目,尤其是發生在模型要準備落地應用,需要驗證黑盒子是不是依照正確的邏輯、人類的邏輯去判斷問題,我自己很喜歡這個部分,算法是用一套最基本的SHAP,SHAP基於博
Thumbnail
今年的國泰金控技術年會,關於 AI 有幾個主題覺得很有趣、也受到一些啟發: 1. 可解釋 AI : AI 的可解釋性一直是一個很被關注的題目,尤其是發生在模型要準備落地應用,需要驗證黑盒子是不是依照正確的邏輯、人類的邏輯去判斷問題,我自己很喜歡這個部分,算法是用一套最基本的SHAP,SHAP基於博
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
這篇文章記錄作者透過多輪語言互動,打造具備語意對齊、語用協調與行為演化能力的個人化AI系統,探索如何藉由語言訓練讓AI理解語境、調整策略、主動生成行動,進而成為真正理解使用者的數位分身與決策助手
Thumbnail
這篇文章記錄作者透過多輪語言互動,打造具備語意對齊、語用協調與行為演化能力的個人化AI系統,探索如何藉由語言訓練讓AI理解語境、調整策略、主動生成行動,進而成為真正理解使用者的數位分身與決策助手
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
這篇不是技術白皮書,僅是站在 2025 年尾聲的觀察: LLM 還是你心中的那個答案嗎? 算力再上去一點,電力再多消耗一點,scaling up 就真的會帶著我們走向 AGI 的終點嗎? 還是你更認同 Yann LeCun 的「世界模型」觀點——他認為 LLM 缺乏對物理世界的真實理解,單純依
Thumbnail
這篇不是技術白皮書,僅是站在 2025 年尾聲的觀察: LLM 還是你心中的那個答案嗎? 算力再上去一點,電力再多消耗一點,scaling up 就真的會帶著我們走向 AGI 的終點嗎? 還是你更認同 Yann LeCun 的「世界模型」觀點——他認為 LLM 缺乏對物理世界的真實理解,單純依
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
AI記者的定義 AI記者是一種利用AI智慧生成技術來自動創作新聞稿的應用。它基於機器學習和自然語言處理技術,旨在模擬人類記者的寫作風格和邏輯思維,以生成高質量的新聞內容。
Thumbnail
AI記者的定義 AI記者是一種利用AI智慧生成技術來自動創作新聞稿的應用。它基於機器學習和自然語言處理技術,旨在模擬人類記者的寫作風格和邏輯思維,以生成高質量的新聞內容。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
本文探討 2025 年針對大型語言模型幻覺問題提出的新技術、演算法革新及學術研究。報告首先重塑了幻覺的分類學,並分析了代理系統中的新型態幻覺。接著,深入剖析了混合架構、推理時干預及分層對比解碼等「最佳解」。報告引用權威基準,量化評估先進模型的準確率與幻覺率,並總結出建構多層次防禦體系為降低幻覺風險。
Thumbnail
本文探討 2025 年針對大型語言模型幻覺問題提出的新技術、演算法革新及學術研究。報告首先重塑了幻覺的分類學,並分析了代理系統中的新型態幻覺。接著,深入剖析了混合架構、推理時干預及分層對比解碼等「最佳解」。報告引用權威基準,量化評估先進模型的準確率與幻覺率,並總結出建構多層次防禦體系為降低幻覺風險。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News