學習LLM大語言模型之路(四) - AI幻覺

宅D嘉

發佈於LLM大語言模型

更新於 2025/06/01發佈於 2025/05/31閱讀時間約 5 分鐘

AI幻覺（AI Hallucination）是指人工智慧（AI）生成的內容包含錯誤、不準確或完全虛構的資訊，但卻表現得像是真實可靠的答案。這種現象通常發生在大型語言模型（LLM）或其他生成式AI系統中，並可能導致誤導性的結果。

AI幻覺的主要類型

捏造的事實：AI可能會生成看似合理但完全不存在的資訊。例如，編造虛假的人物、地點、事件或學術研究。
錯誤引用：AI可能提供不存在的文獻、來源或研究，導致用戶無法驗證相關資訊。
誤解語境：AI可能錯誤地解釋使用者的問題，導致回應偏離原始意圖。
邏輯錯誤：AI可能會混合不相關的概念，使其看起來合理，但實際上並不成立。
語法或語意錯誤：即使回應在語法上正確，它仍然可能在語意上無法被理解或不符合背景知識。

造成AI幻覺的原因

訓練數據的限制：AI的知識來源於已訓練的資料，若訓練數據不完整或有偏誤，就可能產生錯誤內容。
機率驅動的回答機制：LLM使用機率來生成語言，因此有時候可能會「猜測」答案而不是提供準確資訊。
缺乏即時驗證：AI模型通常無法直接存取最新的資料或進行即時查證，使得幻覺問題更嚴重。
上下文錯誤解析：如果AI無法正確理解用戶的提問，它可能會根據類似的內容猜測答案，導致幻覺。

如何減少AI幻覺

驗證資訊：對AI提供的數據進行交叉比對，使用可靠來源確認其真實性。
提供清晰的問題：讓AI更精確地理解提問的內容，減少錯誤推測的可能性。
使用AI輔助工具：選擇具有檢索功能或能引用外部資料的AI系統，以增強準確性。
結合人類審查：不完全依賴AI，人工審查仍然是確保資訊準確性的關鍵。

這裡有幾個真實發生過的AI幻覺案例，展示大型語言模型在不同情境下可能出錯的方式：

1. 捏造的學術研究

在某些情境下，LLM可能會生成完全不存在的學術論文。例如，某些使用者要求AI提供某個領域的研究報告，AI可能會編造一篇論文，包含虛假的作者、期刊名稱和DOI號碼，使其看起來像是可驗證的資料，但實際上這些研究並不存在。

2. 錯誤的醫學建議

有使用者曾詢問AI關於某種疾病的治療方法，AI可能會提供錯誤或尚未獲得醫學認可的療法。例如，在一個案例中，AI建議某種藥物與特定食品一起使用，以「增強療效」，但這種組合其實可能帶來嚴重的副作用，且並無臨床支持。

3. 偽造的技術文件

在軟體工程領域，有時AI會提供錯誤的API文件或函式庫使用方法。例如，有開發者詢問某個程式語言的函式，但AI生成的文件內容可能包含不存在的參數或錯誤的函式名稱，導致程式執行時出現錯誤。

4. 歷史錯誤

有些AI可能會錯誤地描述歷史事件，例如混淆年份、地點或人物。例如，一些LLM曾錯誤地宣稱某位歷史人物參與了一場他們實際上並未參加的戰役，或是將不同時代的事件合併在一起。

5. 幻覺式法律解釋

某些AI可能會生成不正確的法律解釋，例如錯誤引用某國法規或編造新的法律條款，使人誤以為其具有法律效力。有些人曾請AI提供美國某州的最新法律條文，但AI卻生成了完全不存在的法規，使查詢者誤判法律適用性。

如何應對這些AI幻覺

當你在使用LLM（如OpenAI API或LangChain）進行開發時，可以透過以下方法減少幻覺：

設計提示工程策略：透過正確的prompt引導AI，讓它提供更準確的回答。
結合檢索增強生成（RAG）：確保AI可以直接查詢可靠的外部資料來源，避免捏造資訊。
使用FAISS或ChromaDB進行向量檢索：存儲高質量資料並進行向量搜尋，以獲得更精確的結果。
人工驗證：在高風險領域（如醫學、法律、技術）中，永遠確保人類審查環節。

學習成果

理解了什麼是AI幻覺，AI幻覺的主要類型、造成原因、如何減少(應對)幻覺，讓AI的回答更為準確，減少或避免出現AI幻覺，上篇我們已經提到prompt engineering(提示工程)了，可以用不同的策略讓LLM生成更準確、符合需求的回應，減少出現幻覺，後續可以繼續學習結合檢索增強生成（RAG）、使用FAISS或ChromaDB進行向量檢索讓AI可以更精準的回答我們的問題，另外由於和AI的交互是需要花費金錢的，所以在成本的控管上也是需要了解的，各大語言模型調用花費，如何微調參數，降低計算成本也是很值得探討的。

留言

留言分享你的想法！

宅D嘉的開發人生

21會員

50內容數

加密貨幣很有趣，遊戲開發也很有趣，AI也有點意思，身為一個跨多領域的軟體工程師，喜歡研究新鮮的事物，歡迎來到我的世界，一起坐上這艘開往未來探索新奇的列車。

宅D嘉的開發人生的其他內容

2025/05/24

學習LLM大語言模型之路(三) - Prompt Engineering 策略和實作

本篇探討 Prompt Engineering 的策略與應用，並介紹一個 Prompt Engineering 實驗平臺專案，平臺允許使用者輸入任務敘述、選擇風格和提示策略，比較不同 Prompt 的回應結果，有助於學習如何設計 Prompt 模板來影響 LLM 行為及比較不同提示策略對結果的影響。

2025/05/24

學習LLM大語言模型之路(三) - Prompt Engineering 策略和實作

2025/05/17

學習LLM大語言模型之路(二) - 大型語言模型最佳化：數據處理、向量搜尋與模型微調

學習內容：了解 Tokenization、Embedding、向量搜索（FAISS、Chroma）學習如何微調 LLM（LoRA、PEFT）準備數據集（清理、標註、格式化）

2025/05/17

學習LLM大語言模型之路(二) - 大型語言模型最佳化：數據處理、向量搜尋與模型微調

學習內容：了解 Tokenization、Embedding、向量搜索（FAISS、Chroma）學習如何微調 LLM（LoRA、PEFT）準備數據集（清理、標註、格式化）

2025/05/10

學習LLM大語言模型之路(一) - 大型語言模型 (LLM) 入門指南：原理、工具與模型探索

學習內容：了解 LLM 的基本原理（Transformer、Attention 機制）熟悉 Hugging Face、OpenAI API、LangChain 等工具探索不同 LLM 模型（GPT、Llama、Claude、Mistral）

2025/05/10

學習LLM大語言模型之路(一) - 大型語言模型 (LLM) 入門指南：原理、工具與模型探索

學習內容：了解 LLM 的基本原理（Transformer、Attention 機制）熟悉 Hugging Face、OpenAI API、LangChain 等工具探索不同 LLM 模型（GPT、Llama、Claude、Mistral）

看更多

你可能也想看

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》，我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物；這次活動不僅送出了許多獎勵，也反映了「內容有價」——創作不只是分享、紀錄，也能用各種不同形式變現、帶來實際收入。

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

方格子 vocus 官方沙龍

徵才：社群與內容行銷專員 (Community & Marketing Specialist)

嗨！歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台，並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈！「創作至上」是我們的核心價值，我們致力於透過平台功能與服務，賦予創作者更多的可能。 vocus 平台匯聚了

#vocus#徵才#社群行銷

2025/08/11

方格子 vocus 官方沙龍

徵才：社群與內容行銷專員 (Community & Marketing Specialist)

#vocus#徵才#社群行銷

2025/08/11

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

EC3

【 AI繪圖使用心得】

什麼是ＡＩ？ Artificial Intellgent ㄧ個數位大腦電腦新物種模擬人類的腦神經整合２Ｄ與３Ｄ的繪圖視覺在Bing 裡面基本上分為這幾個類型: 逼真的３Ｄ動畫動畫虛擬人偶展示攝影可愛貼圖二為圖例電腦科幻虛擬人偶公司標誌卡通電影海

2024/06/17

2024/06/17

生成式AI（Generative AI）能夠創造新內容和想法，包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型，以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用，設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。

2024/05/19

2024/05/19

本篇文章分享了對創意和靈感來源的深入思考，以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法，提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用，以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。

2024/05/05

2024/05/05

人工智慧還是人工笨笨？人工智能在寫作中文的常見語病

本文探討使用人工智能寫作中文教材時可能遇到的語言錯誤。透過例子指出常見的語病，包括誤解詞語、詞類誤用、前文後理不通和累贅表述。建議使用者在檢查由AI生成的教材時，應特別注意可能出現的語言錯誤，以確保教材的品質和邏輯連貫性。

#人工智能#寫作#Instagram

2024/04/19

陳星晴老師-教育斜棟人生

人工智慧還是人工笨笨？人工智能在寫作中文的常見語病

#人工智能#寫作#Instagram

2024/04/19

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

2024/02/23

2024/02/23

AI生成圖片氾濫，怎麼識別 AI 產生的圖片？3 大 AI 內容識別技術

AI 創作內容 (AIGC) 技術突飛猛進，人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」，進而信任圖片的真實性，如：微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術，幫助使用

#AI

2024/02/19