學習LLM大語言模型之路(四) - AI幻覺

更新於 發佈於 閱讀時間約 5 分鐘

AI幻覺(AI Hallucination)是指人工智慧(AI)生成的內容包含錯誤、不準確或完全虛構的資訊,但卻表現得像是真實可靠的答案。這種現象通常發生在大型語言模型(LLM)或其他生成式AI系統中,並可能導致誤導性的結果。

AI幻覺的主要類型

  1. 捏造的事實:AI可能會生成看似合理但完全不存在的資訊。例如,編造虛假的人物、地點、事件或學術研究。
  2. 錯誤引用:AI可能提供不存在的文獻、來源或研究,導致用戶無法驗證相關資訊。
  3. 誤解語境:AI可能錯誤地解釋使用者的問題,導致回應偏離原始意圖。
  4. 邏輯錯誤:AI可能會混合不相關的概念,使其看起來合理,但實際上並不成立。
  5. 語法或語意錯誤:即使回應在語法上正確,它仍然可能在語意上無法被理解或不符合背景知識。

造成AI幻覺的原因

  1. 訓練數據的限制:AI的知識來源於已訓練的資料,若訓練數據不完整或有偏誤,就可能產生錯誤內容。
  2. 機率驅動的回答機制:LLM使用機率來生成語言,因此有時候可能會「猜測」答案而不是提供準確資訊。
  3. 缺乏即時驗證:AI模型通常無法直接存取最新的資料或進行即時查證,使得幻覺問題更嚴重。
  4. 上下文錯誤解析:如果AI無法正確理解用戶的提問,它可能會根據類似的內容猜測答案,導致幻覺。

如何減少AI幻覺

  • 驗證資訊:對AI提供的數據進行交叉比對,使用可靠來源確認其真實性。
  • 提供清晰的問題:讓AI更精確地理解提問的內容,減少錯誤推測的可能性。
  • 使用AI輔助工具:選擇具有檢索功能或能引用外部資料的AI系統,以增強準確性。
  • 結合人類審查:不完全依賴AI,人工審查仍然是確保資訊準確性的關鍵。

這裡有幾個真實發生過的AI幻覺案例,展示大型語言模型在不同情境下可能出錯的方式:

1. 捏造的學術研究

在某些情境下,LLM可能會生成完全不存在的學術論文。例如,某些使用者要求AI提供某個領域的研究報告,AI可能會編造一篇論文,包含虛假的作者、期刊名稱和DOI號碼,使其看起來像是可驗證的資料,但實際上這些研究並不存在。

2. 錯誤的醫學建議

有使用者曾詢問AI關於某種疾病的治療方法,AI可能會提供錯誤或尚未獲得醫學認可的療法。例如,在一個案例中,AI建議某種藥物與特定食品一起使用,以「增強療效」,但這種組合其實可能帶來嚴重的副作用,且並無臨床支持。

3. 偽造的技術文件

在軟體工程領域,有時AI會提供錯誤的API文件或函式庫使用方法。例如,有開發者詢問某個程式語言的函式,但AI生成的文件內容可能包含不存在的參數或錯誤的函式名稱,導致程式執行時出現錯誤。

4. 歷史錯誤

有些AI可能會錯誤地描述歷史事件,例如混淆年份、地點或人物。例如,一些LLM曾錯誤地宣稱某位歷史人物參與了一場他們實際上並未參加的戰役,或是將不同時代的事件合併在一起。

5. 幻覺式法律解釋

某些AI可能會生成不正確的法律解釋,例如錯誤引用某國法規或編造新的法律條款,使人誤以為其具有法律效力。有些人曾請AI提供美國某州的最新法律條文,但AI卻生成了完全不存在的法規,使查詢者誤判法律適用性。

如何應對這些AI幻覺

當你在使用LLM(如OpenAI API或LangChain)進行開發時,可以透過以下方法減少幻覺:

  • 設計提示工程策略:透過正確的prompt引導AI,讓它提供更準確的回答。
  • 結合檢索增強生成(RAG):確保AI可以直接查詢可靠的外部資料來源,避免捏造資訊。
  • 使用FAISS或ChromaDB進行向量檢索:存儲高質量資料並進行向量搜尋,以獲得更精確的結果。
  • 人工驗證:在高風險領域(如醫學、法律、技術)中,永遠確保人類審查環節。


學習成果

理解了什麼是AI幻覺,AI幻覺的主要類型造成原因如何減少(應對)幻覺,讓AI的回答更為準確,減少或避免出現AI幻覺,上篇我們已經提到prompt engineering(提示工程)了,可以用不同的策略讓LLM生成更準確、符合需求的回應,減少出現幻覺,後續可以繼續學習結合檢索增強生成(RAG)使用FAISS或ChromaDB進行向量檢索讓AI可以更精準的回答我們的問題,另外由於和AI的交互是需要花費金錢的,所以在成本的控管上也是需要了解的,各大語言模型調用花費,如何微調參數,降低計算成本也是很值得探討的。






留言
avatar-img
留言分享你的想法!
avatar-img
宅D嘉的開發人生
20會員
48內容數
加密貨幣很有趣,遊戲開發也很有趣,AI也有點意思,身為一個跨多領域的軟體工程師,喜歡研究新鮮的事物,歡迎來到我的世界,一起坐上這艘開往未來探索新奇的列車。
宅D嘉的開發人生的其他內容
2025/05/24
本篇探討 Prompt Engineering 的策略與應用,並介紹一個 Prompt Engineering 實驗平臺專案,平臺允許使用者輸入任務敘述、選擇風格和提示策略,比較不同 Prompt 的回應結果,有助於學習如何設計 Prompt 模板來影響 LLM 行為及比較不同提示策略對結果的影響。
Thumbnail
2025/05/24
本篇探討 Prompt Engineering 的策略與應用,並介紹一個 Prompt Engineering 實驗平臺專案,平臺允許使用者輸入任務敘述、選擇風格和提示策略,比較不同 Prompt 的回應結果,有助於學習如何設計 Prompt 模板來影響 LLM 行為及比較不同提示策略對結果的影響。
Thumbnail
2025/05/17
學習內容: 了解 Tokenization、Embedding、向量搜索(FAISS、Chroma) 學習如何微調 LLM(LoRA、PEFT) 準備數據集(清理、標註、格式化)
Thumbnail
2025/05/17
學習內容: 了解 Tokenization、Embedding、向量搜索(FAISS、Chroma) 學習如何微調 LLM(LoRA、PEFT) 準備數據集(清理、標註、格式化)
Thumbnail
2025/05/10
學習內容: 了解 LLM 的基本原理(Transformer、Attention 機制) 熟悉 Hugging Face、OpenAI API、LangChain 等工具 探索不同 LLM 模型(GPT、Llama、Claude、Mistral)
Thumbnail
2025/05/10
學習內容: 了解 LLM 的基本原理(Transformer、Attention 機制) 熟悉 Hugging Face、OpenAI API、LangChain 等工具 探索不同 LLM 模型(GPT、Llama、Claude、Mistral)
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
本篇文章分享了對創意和靈感來源的深入思考,以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法,提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用,以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。
Thumbnail
本篇文章分享了對創意和靈感來源的深入思考,以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法,提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用,以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。
Thumbnail
本文探討使用人工智能寫作中文教材時可能遇到的語言錯誤。透過例子指出常見的語病,包括誤解詞語、詞類誤用、前文後理不通和累贅表述。建議使用者在檢查由AI生成的教材時,應特別注意可能出現的語言錯誤,以確保教材的品質和邏輯連貫性。
Thumbnail
本文探討使用人工智能寫作中文教材時可能遇到的語言錯誤。透過例子指出常見的語病,包括誤解詞語、詞類誤用、前文後理不通和累贅表述。建議使用者在檢查由AI生成的教材時,應特別注意可能出現的語言錯誤,以確保教材的品質和邏輯連貫性。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News