學習LLM大語言模型之路(四) - AI幻覺

更新於 發佈於 閱讀時間約 5 分鐘

AI幻覺(AI Hallucination)是指人工智慧(AI)生成的內容包含錯誤、不準確或完全虛構的資訊,但卻表現得像是真實可靠的答案。這種現象通常發生在大型語言模型(LLM)或其他生成式AI系統中,並可能導致誤導性的結果。

AI幻覺的主要類型

  1. 捏造的事實:AI可能會生成看似合理但完全不存在的資訊。例如,編造虛假的人物、地點、事件或學術研究。
  2. 錯誤引用:AI可能提供不存在的文獻、來源或研究,導致用戶無法驗證相關資訊。
  3. 誤解語境:AI可能錯誤地解釋使用者的問題,導致回應偏離原始意圖。
  4. 邏輯錯誤:AI可能會混合不相關的概念,使其看起來合理,但實際上並不成立。
  5. 語法或語意錯誤:即使回應在語法上正確,它仍然可能在語意上無法被理解或不符合背景知識。

造成AI幻覺的原因

  1. 訓練數據的限制:AI的知識來源於已訓練的資料,若訓練數據不完整或有偏誤,就可能產生錯誤內容。
  2. 機率驅動的回答機制:LLM使用機率來生成語言,因此有時候可能會「猜測」答案而不是提供準確資訊。
  3. 缺乏即時驗證:AI模型通常無法直接存取最新的資料或進行即時查證,使得幻覺問題更嚴重。
  4. 上下文錯誤解析:如果AI無法正確理解用戶的提問,它可能會根據類似的內容猜測答案,導致幻覺。

如何減少AI幻覺

  • 驗證資訊:對AI提供的數據進行交叉比對,使用可靠來源確認其真實性。
  • 提供清晰的問題:讓AI更精確地理解提問的內容,減少錯誤推測的可能性。
  • 使用AI輔助工具:選擇具有檢索功能或能引用外部資料的AI系統,以增強準確性。
  • 結合人類審查:不完全依賴AI,人工審查仍然是確保資訊準確性的關鍵。

這裡有幾個真實發生過的AI幻覺案例,展示大型語言模型在不同情境下可能出錯的方式:

1. 捏造的學術研究

在某些情境下,LLM可能會生成完全不存在的學術論文。例如,某些使用者要求AI提供某個領域的研究報告,AI可能會編造一篇論文,包含虛假的作者、期刊名稱和DOI號碼,使其看起來像是可驗證的資料,但實際上這些研究並不存在。

2. 錯誤的醫學建議

有使用者曾詢問AI關於某種疾病的治療方法,AI可能會提供錯誤或尚未獲得醫學認可的療法。例如,在一個案例中,AI建議某種藥物與特定食品一起使用,以「增強療效」,但這種組合其實可能帶來嚴重的副作用,且並無臨床支持。

3. 偽造的技術文件

在軟體工程領域,有時AI會提供錯誤的API文件或函式庫使用方法。例如,有開發者詢問某個程式語言的函式,但AI生成的文件內容可能包含不存在的參數或錯誤的函式名稱,導致程式執行時出現錯誤。

4. 歷史錯誤

有些AI可能會錯誤地描述歷史事件,例如混淆年份、地點或人物。例如,一些LLM曾錯誤地宣稱某位歷史人物參與了一場他們實際上並未參加的戰役,或是將不同時代的事件合併在一起。

5. 幻覺式法律解釋

某些AI可能會生成不正確的法律解釋,例如錯誤引用某國法規或編造新的法律條款,使人誤以為其具有法律效力。有些人曾請AI提供美國某州的最新法律條文,但AI卻生成了完全不存在的法規,使查詢者誤判法律適用性。

如何應對這些AI幻覺

當你在使用LLM(如OpenAI API或LangChain)進行開發時,可以透過以下方法減少幻覺:

  • 設計提示工程策略:透過正確的prompt引導AI,讓它提供更準確的回答。
  • 結合檢索增強生成(RAG):確保AI可以直接查詢可靠的外部資料來源,避免捏造資訊。
  • 使用FAISS或ChromaDB進行向量檢索:存儲高質量資料並進行向量搜尋,以獲得更精確的結果。
  • 人工驗證:在高風險領域(如醫學、法律、技術)中,永遠確保人類審查環節。


學習成果

理解了什麼是AI幻覺,AI幻覺的主要類型造成原因如何減少(應對)幻覺,讓AI的回答更為準確,減少或避免出現AI幻覺,上篇我們已經提到prompt engineering(提示工程)了,可以用不同的策略讓LLM生成更準確、符合需求的回應,減少出現幻覺,後續可以繼續學習結合檢索增強生成(RAG)使用FAISS或ChromaDB進行向量檢索讓AI可以更精準的回答我們的問題,另外由於和AI的交互是需要花費金錢的,所以在成本的控管上也是需要了解的,各大語言模型調用花費,如何微調參數,降低計算成本也是很值得探討的。






留言
avatar-img
留言分享你的想法!
avatar-img
宅D嘉的開發人生
21會員
50內容數
加密貨幣很有趣,遊戲開發也很有趣,AI也有點意思,身為一個跨多領域的軟體工程師,喜歡研究新鮮的事物,歡迎來到我的世界,一起坐上這艘開往未來探索新奇的列車。
宅D嘉的開發人生的其他內容
2025/05/24
本篇探討 Prompt Engineering 的策略與應用,並介紹一個 Prompt Engineering 實驗平臺專案,平臺允許使用者輸入任務敘述、選擇風格和提示策略,比較不同 Prompt 的回應結果,有助於學習如何設計 Prompt 模板來影響 LLM 行為及比較不同提示策略對結果的影響。
Thumbnail
2025/05/24
本篇探討 Prompt Engineering 的策略與應用,並介紹一個 Prompt Engineering 實驗平臺專案,平臺允許使用者輸入任務敘述、選擇風格和提示策略,比較不同 Prompt 的回應結果,有助於學習如何設計 Prompt 模板來影響 LLM 行為及比較不同提示策略對結果的影響。
Thumbnail
2025/05/17
學習內容: 了解 Tokenization、Embedding、向量搜索(FAISS、Chroma) 學習如何微調 LLM(LoRA、PEFT) 準備數據集(清理、標註、格式化)
Thumbnail
2025/05/17
學習內容: 了解 Tokenization、Embedding、向量搜索(FAISS、Chroma) 學習如何微調 LLM(LoRA、PEFT) 準備數據集(清理、標註、格式化)
Thumbnail
2025/05/10
學習內容: 了解 LLM 的基本原理(Transformer、Attention 機制) 熟悉 Hugging Face、OpenAI API、LangChain 等工具 探索不同 LLM 模型(GPT、Llama、Claude、Mistral)
Thumbnail
2025/05/10
學習內容: 了解 LLM 的基本原理(Transformer、Attention 機制) 熟悉 Hugging Face、OpenAI API、LangChain 等工具 探索不同 LLM 模型(GPT、Llama、Claude、Mistral)
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
本篇文章分享了對創意和靈感來源的深入思考,以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法,提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用,以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。
Thumbnail
本篇文章分享了對創意和靈感來源的深入思考,以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法,提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用,以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。
Thumbnail
本文探討使用人工智能寫作中文教材時可能遇到的語言錯誤。透過例子指出常見的語病,包括誤解詞語、詞類誤用、前文後理不通和累贅表述。建議使用者在檢查由AI生成的教材時,應特別注意可能出現的語言錯誤,以確保教材的品質和邏輯連貫性。
Thumbnail
本文探討使用人工智能寫作中文教材時可能遇到的語言錯誤。透過例子指出常見的語病,包括誤解詞語、詞類誤用、前文後理不通和累贅表述。建議使用者在檢查由AI生成的教材時,應特別注意可能出現的語言錯誤,以確保教材的品質和邏輯連貫性。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News