大型語言模型中的幻覺問題

Kiki

更新於 2024/12/07發佈於 2024/12/07閱讀時間約 3 分鐘

大型語言模型(Large Language Model, LLM)中的幻覺通常指模型產生不真實、錯誤、不一致或無意義的內容。我認為幻覺可以分成兩種類型：

上下文內幻覺：模型輸出不與輸入上下文中的內容一致。
外在幻覺：模型輸出不以預訓練資料集為基礎。我們可試圖確保模型輸出是基於事實的，並可以通過外部世界知識進行驗證。同樣重要的是，當模型不知道某個事實時，它應該表現出來。

為了避免幻覺，大型語言模型需要（1）基於事實，（2）在合適的情況下承認不知道答案。

什麼導致幻覺？

常見的原因存在兩個地方:1. 預訓練資料問題 2. 微調新知識

預訓練資料問題

預訓練資料集的資料數量很大，因為這些資料集被假設代表世界上所有可用形式的知識。從網路擷取的資料是最常見的資料來源，因此不可避免的會出現過時、缺失或不正確的訊息。由於模型可能通過簡單地最大化對數相似性來錯誤地記憶這些訊息，因此我們會預期模型會犯錯。

微調新知識

通過監督微調和RLHF（基於人類反饋的強化學習）來微調預訓練的LLM是提高模型某些能力（如遵循指令）的常見技術。在微調階段引入新知識是難以避免的。微調通常消耗的計算資源要少得多，這使得模型是否能通過小規模微調可靠地學習新知識成為一個值得討論的問題。Gekhman等人（2024年）[1] 研究了微調LLM以學習新知識是否會鼓勵幻覺的問題。他們發現：（1）與模型已有知識一致的例子相比，LLM學習包含新知識的微調例子的速度更慢；（2）一旦最終學習了包含新知識的例子，它們會增加模型產生幻覺的傾向。

避免幻覺

了解產生幻覺的原因後，學者們開始思考如何避免或減少幻覺的產生。

GopherCite（Menick等人，2022年）[2] 使用搜索引擎取得佐證材料並教導模型提供參考考資料。其進行監督式微調來引導模型，並且應用基於人類偏好的強化學習來訓練。但與依賴複製人類示範行為的WebGPT不同，GopherCite透過少量樣本提示來生成示例，每次生成都使用相關文件填充上下文，然後使用獎勵模型來評比哪些模型輸出是最佳的。

FAVA（「使用增強知識進行事實性驗證」；Mishra等人，2024年）[3] 檢索相關文檔，然後編輯模型輸出以避免幻覺錯誤。FAVA模型由檢索器 $\mathcal{M}\text{ret}$ 和編輯器 $\mathcal{M}\text{edit}$ 組成。

Reference

https://arxiv.org/abs/2405.05904
https://arxiv.org/abs/2203.11147
https://arxiv.org/abs/2401.06855

1會員

37內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

留言

留言分享你的想法！

Kiki的沙龍的其他內容

以流為基礎的深度生成模型

以流為基礎的深度生成模型藉助正規化流這一強大的統計工具來解決密度估計這個困難問題。對 p(x) 的良好估計使得有效完成許多下游任務成為可能：取樣未觀察到但真實的新數據點（數據生成）、預測未來事件的稀有程度（密度估計）、推斷潛在變量、填補不完整的數據樣本等。

#機器學習 #人工智慧 #AI深度學習

擴散模型(Diffusion Models)簡介

擴散模型受非均衡熱力學啟發。非均衡熱力學定義了一個擴散步驟的馬可夫鏈，逐步向資料添加隨機資訊，然後學習如何逆轉擴散過程，從隨機資訊中建構所需的樣本資料。與變分自編碼器（VAE）或以流為基礎的模型不同，擴散模型是通過固定程序學習的，且其潛在變量具有高維度（與原始資料相同）。

#機器學習 #人工智慧 #生成

初探深度學習

深度學習是什麼? 簡單來說，深度學習是大型且多層的人工神經網路。我們可以想像神經網路（"Neural Nnetwork, NN"）是一種有向無環圖，此圖可拆分成三個部分來看: 1. 輸入層接收信號向量；2. 一個或多個隱藏層處理前一層的輸出; 3. 輸出層統合之前所有隱藏層的處理結果。神經網路的初

#機器學習 #模型 #數據

3GPP研究與學習相關的參考資料

3GPP官方網站和工具這些是獲取3GPP（第三代合作夥伴計劃）最新資訊的主要來源。對於研究人員和業界專業人士來說，3GPP官方資訊可供理解、實作和測試3GPP標準。另一方面，對於進行移動通訊研究的學者和學生來說，這些資源是深入了解最新技術標準和發展趨勢的重要途徑。

#3GPP #研究人員

以流為基礎的深度生成模型

#機器學習 #人工智慧 #AI深度學習

擴散模型(Diffusion Models)簡介

你可能也想看

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

#方格人氣王 #方格留言王 #方格愛心王

Compostela

2025/03/19

AI 筆記工具大評比：NotebookLM、OneNote、Notion AI 分析

本文探討AI筆記工具的優缺點、選擇建議及未來趨勢，比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具，並強調安全注意事項及個人需求評估的重要性。

全方位分析脫離繼承戰的方法，大膽猜測誰會成為卡丁國下一任國王。

#獵人 #HUNTER×HUNTER #繼承戰懶人包

YJW的沙龍

2024/08/11

預言家

生活實驗八四六想要提前說出正確的事的那種症狀，是不是一種直覺力的培養與實踐。但猜錯了的話，不是輸了，就是必須要道歉。

礦石、遊戲、旅程

2024/08/07

辨別真實與虛幻：一場人生的劇本

在這篇文章中，我們探討了在當今社會中，如何分辨虛擬與真實之間的界線。透過直覺和感受，我們需要挑戰媒體呈現的假象，並仔細觀察周圍的細節。文章強調選擇與自己價值觀一致的劇本，並明白善惡的相對性，使每個人都能在這個複雜的世界中找到自己的立場。無論你選擇扮演哪種角色，重要的是掌握選擇與操控的權力。

。

HAI (Human-AI Integration) 阻礙我們認識真理的，不是事物的假象，也不是我們推理能力的缺陷，而往往是我們心中積累的偏見。這些偏見讓我們陷入困境，因為真相往往與我們所認為的不同。我們甚至會給這些偏見披上合理的外衣，使自己相信它們是正確的。我們經常在重複過去的錯誤時，自以為

鏡莫隨筆

2024/07/19

話語真實性 - 謊言與真實

跳脫一下跟工作相關的思緒，來撰寫一些不一樣的東西，相信諸君都聽過[事情的發生往往來自於溝通不足]，然而真的只是溝通不足產生的嗎?在下覺得並非如此，當今社會與科學所教的皆是懷疑，造成了[話中虛幻多有詐，人本不信只為安]的現況，舉凡話語中所參雜的真實與否，真幻交織，根本無法認清，只能回歸到最初謊言與真實

#教育 #生活職場 #社會