📝📝:不存在的堡壘、畸形的手部、七趾的腳|AI 生成的內容正在汙染維基百科

更新於 發佈於 閱讀時間約 5 分鐘





【本文翻譯自 The Editors Protecting Wikipedia from AI Hoaxes




一群 Wikipedia 編輯組成了名為「WikiProject AI Cleanup」的團隊。目標是清理未經引用文筆拙劣的 AI 生成內容,以保護這座全球最大的資料庫,避免受到錯誤條目的汙染。

這些 AI 生成的錯誤資料,不僅影響了 Google 搜尋結果,其中也包含亞馬遜銷售的書籍;甚至,學術期刊也面臨類似的問題。

不自然的寫作風格

WikiProject AI Cleanup 的創始成員 Ilyas Lebleu 表示:

這個專案的發起源自於部分成員注意到一些 Wikipedia 不自然的寫作風格

編輯們猜測這些風格來自 AI,他們也成功用 ChatGPT 再製了這些文類風。Lebleu 提到:

「找到了幾個常見的 AI 生成用語後,我們就能迅速識別出惡劣的生成內容,並將這些技術整理成一個有系統的專案。」

使用 AI 偵測法識別生成內容

WikiProject AI Cleanup 小組使用,類似於在科學期刊和 Google Books 中尋找 AI 生成內容的方法來檢查 Wikipedia。他們透過搜尋 ChatGPT 常用的詞組來鑑定 AI 生成內容。

其中一個顯著的例子是關於切斯特精神健康中心(Chester Mental Health Center)的條目。該條目在 2023 年 11 月曾包括這樣一句話:

「截至我最近一次知識更新在 2022 年 1 月」

明顯是 AI 模型生成的內容。

不存在的堡壘

然而,並非所有 AI 生成內容都如此容易檢測。另一位成員 Queen of Hearts 發現了關於鄂圖曼堡壘「Amberlisihar」的條目。這篇超過 2000 字的文章寫得非常有條理,甚至包含了:

  • 堡壘名稱
  • 建造細節
  • 參與的建築師

以及該堡壘在第一次世界大戰期間,受到俄軍轟炸後的修復工作;然而,這座堡壘根本不存在。

raw-image

Lebleu 解釋道,假的引文是更具隱匿和危害的問題。因為這些引文可能需要好幾個月才能被察覺,有時,AI 生成的文本會引用真實的學術資源,但引用內容與文章內容毫無關聯。

例如,編輯就有發現一篇關於某種甲蟲的 Wikipedia 條目,引用了一篇法語期刊文章。而實際上那篇文章討論的,是一個完全無關的蟹類物種。

偵測 AI 生成圖片的挑戰

WikiProject AI Cleanup 也處理了AI 生成圖片的問題。團隊在處理一篇關於「Darul Uloom Deoband」的條目,發現了一張看似相關的歷史畫作。

但仔細檢查後發現圖片中的人物,有著明顯的 AI 生成特徵。像是,畸形的手部和一隻七趾的腳。

AI 生成的人手有著相當拙劣的錯誤。由 Leonardo ai 生成。

AI 生成的人手有著相當拙劣的錯誤。由 Leonardo ai 生成。

儘管如此,WikiProject AI Cleanup 仍表示,他們不會僅僅因為圖片是 AI 生成的就移除。如果一篇文章討論到 AI 生成的圖片,那麼這些圖片在條目中就有其存在的合理性。

WikiProject AI Cleanup 所面臨的挑戰之一,是如何平衡 AI 技術的使用與確保條目的準確性。雖然有些 AI 工具(如 GPTZero)已經被作為偵測 AI 生成內容的手段,但 Lebleu 表示這些工具的效果有限,尤其是針對較新的語言模型。

人工審查的重要性

Wikipedia 目前在辨識和過濾 AI 生成內容方面更有效。部分原因在於維基百科長期依賴志願者,來審查新文章並驗證條目以及引用來源。

然而,WikiProject AI Cleanup 的成員也承認,雖然 Wikipedia 社群偵測 AI 生成內容已經做得不錯,還是有許多 AI 生成的內容沒有被及時察覺。

而 Lebleu 和 Queen of Hearts 也都認為,許多大公司在檢測和移除 AI 生成內容成效仍有待加強。他們如果能分配適當的資源,應該能比 Wikipedia 的編輯志工做得更好。

留言
avatar-img
留言分享你的想法!
彼得潘-avatar-img
2024/10/31
最近出現許多視頻旁白是Ai生成的人聲語言 我發現它對破音字很不熟悉 比如重複會讀成ㄓㄨㄥˋㄈㄨˋ;成長會讀成ㄔㄥˊㄔㄤˊ…… 看來Ai不過爾爾 這讓我放心不少。
鋼哥-avatar-img
發文者
2024/10/31
彼得潘 還混雜了很多中國口音!
avatar-img
社會人的哲學沉思
121會員
256內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
AI 警察是什麼?為什麼他們到處檢舉 AI 內容?在網路上,你可能遇過這種人—— 👮‍♂️ 「AI 生成的?垃圾,沒資格存在!」 👮‍♂️ 「這篇文章有 AI 參與?不值得參考!」 等等,「AI 參與 ≠ 內容沒價值」?重點應該是:內容是否有價值,而不是是否由 AI 產生!
Thumbnail
AI 警察是什麼?為什麼他們到處檢舉 AI 內容?在網路上,你可能遇過這種人—— 👮‍♂️ 「AI 生成的?垃圾,沒資格存在!」 👮‍♂️ 「這篇文章有 AI 參與?不值得參考!」 等等,「AI 參與 ≠ 內容沒價值」?重點應該是:內容是否有價值,而不是是否由 AI 產生!
Thumbnail
問題在於,公司是否會重視人類勞動的無形資產 — 創造力、同理心、理解深度,或是將人類輸入,純粹視為機器產生文字的最後清潔人員?
Thumbnail
問題在於,公司是否會重視人類勞動的無形資產 — 創造力、同理心、理解深度,或是將人類輸入,純粹視為機器產生文字的最後清潔人員?
Thumbnail
雖然本文討論的議題對大多數人而言可能太過「前衛」,但是在AI發展與算力堆積速度遠超乎預期的現況下,恐怕在幾年內就會一一實現。 我並不是本領域的專家,只是基於一年多來大量研究及親身使用各類AI的發現與觀察、輔以20多年身心科醫師看診經驗的所見所聞提出問題,希望藉此讓更多人關注這些議題。
Thumbnail
雖然本文討論的議題對大多數人而言可能太過「前衛」,但是在AI發展與算力堆積速度遠超乎預期的現況下,恐怕在幾年內就會一一實現。 我並不是本領域的專家,只是基於一年多來大量研究及親身使用各類AI的發現與觀察、輔以20多年身心科醫師看診經驗的所見所聞提出問題,希望藉此讓更多人關注這些議題。
Thumbnail
一群 Wikipedia 編輯組成了名為「WikiProject AI Cleanup」的團隊。目標是清理未經引用文筆拙劣的 AI 生成內容,以保護這座全球最大的資料庫,避免受到錯誤條目的影響。
Thumbnail
一群 Wikipedia 編輯組成了名為「WikiProject AI Cleanup」的團隊。目標是清理未經引用文筆拙劣的 AI 生成內容,以保護這座全球最大的資料庫,避免受到錯誤條目的影響。
Thumbnail
帶維基媒體工作坊這麼多年了 維基媒體運動有許多不同的開放專案 雖然維基百科(wikipedia)是最知名的一項專案 也是最多社群參與者、合作夥伴會邀請我們開設的工作坊項目 但是現況卻是:多數專案或是地方社群都不適合使用維基百科作為敲門磚
Thumbnail
帶維基媒體工作坊這麼多年了 維基媒體運動有許多不同的開放專案 雖然維基百科(wikipedia)是最知名的一項專案 也是最多社群參與者、合作夥伴會邀請我們開設的工作坊項目 但是現況卻是:多數專案或是地方社群都不適合使用維基百科作為敲門磚
Thumbnail
AI努力中 ................. 。 摘要生成失敗,請刪除文章。
Thumbnail
AI努力中 ................. 。 摘要生成失敗,請刪除文章。
Thumbnail
為演算法服務的免洗人力 (菲爾.瓊斯,商周出版) 人工智慧及演算法的大量應用,卻在你看不到的地方,有Google、亞馬遜、Uber、FB等公司推出的群包平台,透過網路及演算法,把本來請人工作的僱傭關係,打散成支離破碎的Case,然後僱傭關係變成了承攬關係。
Thumbnail
為演算法服務的免洗人力 (菲爾.瓊斯,商周出版) 人工智慧及演算法的大量應用,卻在你看不到的地方,有Google、亞馬遜、Uber、FB等公司推出的群包平台,透過網路及演算法,把本來請人工作的僱傭關係,打散成支離破碎的Case,然後僱傭關係變成了承攬關係。
Thumbnail
臉書(Facebook)、推特(Twitter)、抖音(TikTok)、IG(Instagram)等社交媒體都面臨一個同樣的問題,那就是不當內容的監控,尤其是對於影片的內容。
Thumbnail
臉書(Facebook)、推特(Twitter)、抖音(TikTok)、IG(Instagram)等社交媒體都面臨一個同樣的問題,那就是不當內容的監控,尤其是對於影片的內容。
Thumbnail
在網路上的某處,有一個討論區或是論壇,裡面總是討論一下聊天打哈哈的事情,生活中的瑣碎事務、有時候會遇到的新奇事物、或是最新的網路梗圖。直到某一天,某個來自別國的險惡組織了一批網軍入侵到了這個網站.......
Thumbnail
在網路上的某處,有一個討論區或是論壇,裡面總是討論一下聊天打哈哈的事情,生活中的瑣碎事務、有時候會遇到的新奇事物、或是最新的網路梗圖。直到某一天,某個來自別國的險惡組織了一批網軍入侵到了這個網站.......
Thumbnail
每次遇到"核" 總有種大家一起變成'鴕鳥'的感覺.....><" 冏
Thumbnail
每次遇到"核" 總有種大家一起變成'鴕鳥'的感覺.....><" 冏
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News