AI幻覺：探討生成式AI中的錯誤資訊與挑戰

左先生

發佈於資訊安全演義

2024/09/12 更新2024/09/12 發佈閱讀 3 分鐘

在過去興起的AI應用熱潮，除了大家開始留意到的生成式AI的資訊洩漏外，另一問題也日漸浮現就是「AI幻覺」(Hallucination)。

「AI幻覺」和散佈謠言有點不同，廣義而言，Ai幻覺是指在AI生成的內容裡，充滿不正確、似是而非，其至是虛構與現實重叠的狀態。

像早前外國，就曾試過一個律師使用AI生成文件，結果AI給他引述了一些案例，但原來當中都是「虛構」案例，這種無中生有的情況。

AI幻覺的成因，有幾個可能性。

1. 單就AI訓練而言，可能是訓練的取樣資料不足，導致了AI「沒見過世面」，所以知識很單純。舉例說你丟給它一本香港街道名大全，然後着它寫一個在日本發生的一日遊，它會告訴你在東京行在彌敦道和銅鑼灣的日程。

2. 模型本身的缺憾。如果數據模型本身存在缺憾，AI怎樣訓練也不會得出正確推論，因此訓練出來的永遠也是不正確或不完全的成品。例如「聾子聽到啞巴說盲人見到鬼」這種一本正經地跟你說幹話的情況出現。

3. 惡意注入輸入或者拿了不當的資訊。AI模型的訓練，除了依賴龐大的數據，還要注意是龐大而正確的數據。如果惡意輸入一些似是而非的東西而沒有糾正，AI就會很混亂。舉例說你將《哈利波特》、《飢饑遊戲》這類經典都推給它，又沒糾正當中某些虛幻，當你要求它給你寫一篇遊記的時候，弄不好AI真的會寫你乘着掃把在12區的事情。

根據「大數法則」，在龐大而絕大部份正確的數據下，理論上AI模型訓練能自動排除一些錯誤或故意惡意注入的資訊。但是AI模型的生成，一直也是在訓練中產生也是透過很多重覆運算、嘗試與錯誤中得出的結果。

而人類要做的前期功夫，除了是確保訓練資訊來源是可信賴和正確外，還應該在生成和運作期間，有一套有效的機制去驗證模型生成的內容。這套機制，可以是人手測試(manual testing)或是自動化測試(automated testing)。

人手不難，但耗費人力，抽樣調查也可能要涵蓋很多關鍵字以達成有效監察的目的，實際能做到的比例異常地少。自動化則要訂立一套機制，可能是運用另一套AI模型去互相驗證，一如過往我們在QA測試中常見的測試者和驗證者(Tester and Verifier)的關係。

反而是後期功夫，現時提供AI生成式模型的機構還沒有一套明確和認受性的方式。往往是在公眾使用時出現問題，在網上成為了熱門話題才去作修正。

正因為AI已經以一個飛快的滲透速度融入了普通使用者的生活，各國政府更有逼切去訂立法例去規管這些AI生成式模型所提供的服務，以避免將一個現實都市變成了一個奇幻都市。現時除了個別國家有限制AI生成式服務的存取權外，基本上任一機構也能提供他們自己的生成式服務，不論是付費或是免費。但使用者往往很難分辨當中有沒有一些惡意提供者是故意透過提供AI生成性服務從而達到資訊混淆的目的。

更甚者一些錯誤資訊會嚴重影響人們對現實情況的認知，加上現今網絡使用者容易透過社交媒體和即時通訊軟件的使用習慣令錯誤資訊在網上更廣泛流傳，做成不必要的誤會，甚至社會動盪。

留言

留言分享你的想法！

左先生的沙龍

64會員

174內容數

左先生愛好寫詩，也愛品酒，工作上也喜歡電腦新知。這裡是左先生的輕鬆的生活集散地。

左先生的沙龍的其他內容

2025/01/20

AI人工智慧：超越想像的應用與潛力

本文探討AI人工智慧的應用，涵蓋語音辨識、圖片辨識、翻譯、預測模型建立、資料分析及網路安全等面向，並說明AI如何提升效率及準確性，例如更精準的語音轉文字、更人性化的翻譯、更有效的資料分析及更快速的網路安全威脅偵測等。文章最後提及AI圖像生成的強大能力，並預告後續將深入探討AI運作機制及算力概念。

2025/01/20

AI人工智慧：超越想像的應用與潛力

2024/07/20

2024-07-20 國際藍畫面日，論BCP的重要性

2024年7月19日，全球出現大規模的電腦擋機事故，相信就算不是在IT界發展的，對於微軟視窗的藍畫面也是略有所聞。微軟由很多年前的作業系統版本開始，就有藍底白字顯示錯誤的畫面，也就是所謂的「死機」。這就是世界聞名的Blue Screen of Death (BSoD)。

2024/07/20

2024-07-20 國際藍畫面日，論BCP的重要性

2024/04/16

NIST資訊安全框架2.0

NIST資訊安全框架(NIST Cybersecurity Framework)是美國國家標準與技術研究所(National Institute of Standards and Technology)所提出的一套資訊安全架構標準......

2024/04/16

NIST資訊安全框架2.0

NIST資訊安全框架(NIST Cybersecurity Framework)是美國國家標準與技術研究所(National Institute of Standards and Technology)所提出的一套資訊安全架構標準......

看更多

你可能也想看

Miller的投資沙龍

我的美股ETF篩選筆記

話說身為短線交易者，每天要作的事情就是從盤勢觀察、到籌碼流向，再到經過多維度資料數據交叉比對，盤中盯著分K、江波圖和五檔報價，算計著每一分K線的轉折，雖能換來即時驗證判斷的快感與成就，但長期下來，卻也衍生眼睛與肩頸卻成了抹不去的職業病。

2026/01/05

2026/01/05

AI生成圖片是一個挑戰性的任務，雖然AI能理解文字需求，但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成，而加入擬人化的描述可以讓AI更好地理解需求。無論如何，AI生成圖片仍面臨許多挑戰，需要更多的研究與嘗試。

2024/08/02

2024/08/02

本文討論了雖然人工智慧可以提供大量參考答案，但缺乏感知和直覺，無法主動發現不尋常的情況，因此仍需要人腦確認和解決問題的重要性。同時強調了發現奇怪之處、與人溝通、發現問題點、詢問AI並總結出答案的能力和實作的能力的重要性。

2024/07/11

2024/07/11

生成式AI（Generative AI）能夠創造新內容和想法，包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型，以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用，設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。

2024/05/19

2024/05/19

本篇文章分享了對創意和靈感來源的深入思考，以及如何將其轉化為實際的成果或解決方案的過程。透過學習、資料收集、練習、創新等方法，提出了將創意落實的思路和技巧。同時介紹了AI在外顯知識的自動化應用，以及對其潛在發展方向的討論。最後探討了傳統機器學習技術在模擬中的應用案例和對AI世界的影響。

2024/05/05

2024/05/05

生成式AI（Generative AI）是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎，通過學習大量數據中的模式和關係，能夠生成各種新的內容，涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。

2024/02/19

2024/02/19

AI生成圖片氾濫，怎麼識別 AI 產生的圖片？3 大 AI 內容識別技術

AI 創作內容 (AIGC) 技術突飛猛進，人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」，進而信任圖片的真實性，如：微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術，幫助使用

#AI

2024/02/19