AI幻覺：探討生成式AI中的錯誤資訊與挑戰

左先生

2024/09/12閱讀時間約 3 分鐘

在過去興起的AI應用熱潮，除了大家開始留意到的生成式AI的資訊洩漏外，另一問題也日漸浮現就是「AI幻覺」(Hallucination)。

「AI幻覺」和散佈謠言有點不同，廣義而言，Ai幻覺是指在AI生成的內容裡，充滿不正確、似是而非，其至是虛構與現實重叠的狀態。

像早前外國，就曾試過一個律師使用AI生成文件，結果AI給他引述了一些案例，但原來當中都是「虛構」案例，這種無中生有的情況。

AI幻覺的成因，有幾個可能性。

1. 單就AI訓練而言，可能是訓練的取樣資料不足，導致了AI「沒見過世面」，所以知識很單純。舉例說你丟給它一本香港街道名大全，然後着它寫一個在日本發生的一日遊，它會告訴你在東京行在彌敦道和銅鑼灣的日程。

2. 模型本身的缺憾。如果數據模型本身存在缺憾，AI怎樣訓練也不會得出正確推論，因此訓練出來的永遠也是不正確或不完全的成品。例如「聾子聽到啞巴說盲人見到鬼」這種一本正經地跟你說幹話的情況出現。

3. 惡意注入輸入或者拿了不當的資訊。AI模型的訓練，除了依賴龐大的數據，還要注意是龐大而正確的數據。如果惡意輸入一些似是而非的東西而沒有糾正，AI就會很混亂。舉例說你將《哈利波特》、《飢饑遊戲》這類經典都推給它，又沒糾正當中某些虛幻，當你要求它給你寫一篇遊記的時候，弄不好AI真的會寫你乘着掃把在12區的事情。

根據「大數法則」，在龐大而絕大部份正確的數據下，理論上AI模型訓練能自動排除一些錯誤或故意惡意注入的資訊。但是AI模型的生成，一直也是在訓練中產生也是透過很多重覆運算、嘗試與錯誤中得出的結果。

而人類要做的前期功夫，除了是確保訓練資訊來源是可信賴和正確外，還應該在生成和運作期間，有一套有效的機制去驗證模型生成的內容。這套機制，可以是人手測試(manual testing)或是自動化測試(automated testing)。

人手不難，但耗費人力，抽樣調查也可能要涵蓋很多關鍵字以達成有效監察的目的，實際能做到的比例異常地少。自動化則要訂立一套機制，可能是運用另一套AI模型去互相驗證，一如過往我們在QA測試中常見的測試者和驗證者(Tester and Verifier)的關係。

反而是後期功夫，現時提供AI生成式模型的機構還沒有一套明確和認受性的方式。往往是在公眾使用時出現問題，在網上成為了熱門話題才去作修正。

正因為AI已經以一個飛快的滲透速度融入了普通使用者的生活，各國政府更有逼切去訂立法例去規管這些AI生成式模型所提供的服務，以避免將一個現實都市變成了一個奇幻都市。現時除了個別國家有限制AI生成式服務的存取權外，基本上任一機構也能提供他們自己的生成式服務，不論是付費或是免費。但使用者往往很難分辨當中有沒有一些惡意提供者是故意透過提供AI生成性服務從而達到資訊混淆的目的。

更甚者一些錯誤資訊會嚴重影響人們對現實情況的認知，加上現今網絡使用者容易透過社交媒體和即時通訊軟件的使用習慣令錯誤資訊在網上更廣泛流傳，做成不必要的誤會，甚至社會動盪。

12會員

67內容數

筆者有多年的品飲經驗，持有WSET及國際唎酒師認證，希望將品飲的樂趣介紹給讀者。這個出版專題會以簡單易懂、親民價格的清酒作為分享內容，謝絕太專業向及高價逸品。同時筆者亦會就近年越受重視的資訊保安進行由淺入深的分析，跟進趨勢。相信大家都能輕易進入的才是領域的真正門檻。

留言0

查看全部

發表第一個留言支持創作者！

左先生的沙龍的其他內容

2024-07-20 國際藍畫面日，論BCP的重要性

2024年7月19日，全球出現大規模的電腦擋機事故，相信就算不是在IT界發展的，對於微軟視窗的藍畫面也是略有所聞。微軟由很多年前的作業系統版本開始，就有藍底白字顯示錯誤的畫面，也就是所謂的「死機」。這就是世界聞名的Blue Screen of Death (BSoD)。

#微軟 #Windows #資安

NIST資訊安全框架2.0

NIST資訊安全框架(NIST Cybersecurity Framework)是美國國家標準與技術研究所(National Institute of Standards and Technology)所提出的一套資訊安全架構標準......

#NIST #資安 #ISO27001

關於XZ Utils後門的意見

過去一週，在Linux或是Open-source(開源)社群有一單很轟動的新聞。就是一個名為XZ Utils的開源軟體被植入Backdoor後門程式。事件嚴重的原因，除了是這個軟體被很多大型的Linux分支所採用外，這次事件的元兇被非在重新上傳或在分發時動手腳，而是在源頭做手腳。

#Linux #開源軟體 #資安

香港私隱專員公署就數碼港公司資安事故的調查報告

香港私隱專員公公署今日4/2/2024就數碼港公司去年的資安事故發表了調查報告報告原文: (https://www.pcpd.org.hk/english/news_events/media_statements/press_20240402.html) 事件源於數碼港向私隱專員公署通報資料外

#資訊 #調查報告 #帳戶

2024-03-12 ISO27001:2022 更新版

在當今的數位化時代，企業越來越依賴資訊技術系統來開展業務。隨著對資訊技術系統的依賴程度越來越高，企業必須確保其資料的安全性和完整性。ISO 27001 標準是一項中立和全球通用的標準，旨在為資訊安全管理系統提供了一個框架，隨着時代發現，ISO27001已更新至2022版本，以應對數字環境中不斷變化的

#ISO27001 #審計 #IT審計