最近的研究顯示,維基百科上約有 4.36% 的新文章包含了顯著的AI生成內容。這項研究由普林斯頓大學的團隊進行,使用了名為 GPTZero 和 Binoculars 的工具來檢測AI生成的內容。這一比例相較於2024年8月的數據顯示,AI生成內容在維基百科的出現頻率增加。
研究發現,這些AI生成的文章通常品質較低,引用也較少,在維基百科的知識網絡中融入得不夠好。有些文章甚至顯得自我推銷,涉及個人或商業推廣。此外,部分用戶利用大型語言模型撰寫小眾主題的內容,這些內容往往缺乏深度和可靠性。
維基百科社群對AI生成內容的品質表達了擔憂,並成立了名為 WikiProject AI Cleanup 的團隊,以清理未經引用且文筆拙劣的AI生成內容,以保護維基百科的資料庫。這表明,在AI技術日益普及的背景下,維基百科仍然依賴志願者來審查和驗證新文章,以確保內容的準確性和可靠性。
AI生成內容在科技和科學領域尤為突出,尤其是在電腦科學、人工智慧和資訊科技等主題上。這些領域通常涉及大量的技術術語和概念,AI模型能夠快速產生相關的定義和解釋。例如,關於 人工智慧 的歷史、應用和技術細節的文章經常使用AI生成的文字來填充內容。
健康與醫學領域的維基百科條目也逐漸被AI生成內容所佔據。這些條目包括疾病的描述、治療方法及其效果等。由於這些資訊需要準確且及時,AI產生的內容在某些情況下可能無法提供足夠的深度和可靠性,但仍被用於初步的資訊填充。
在娛樂文化領域,AI生成內容常見於電影、音樂、書籍等主題的介紹。這些條目通常需要涵蓋大量的信息,如作品背景、主要角色及其影響等,AI能夠快速生成相關文本以滿足這些需求。
社會和政治領域的維基百科條目也開始出現AI生成內容。當涉及政策、事件或人物的描述時,AI能夠提供快速的資訊更新,但可能缺乏必要的背景分析和深度。
一些小眾或冷門主題也常常依賴AI生成內容。這些主題可能缺乏足夠的人類編輯參與,因此AI成為填補知識空白的一種方式。儘管如此,這些內容往往面臨準確性和來源引用不足的問題。
AI產生的內容往往缺乏必要的驗證和引用,導致虛假資訊的傳播。例如,維基百科的編輯團隊發現,某些AI產生的條目包含不準確的資訊和無關的引用,這嚴重影響了文章的可信度。有些AI生成的文本使用了不自然的寫作風格,使得內容顯得不連貫或缺乏邏輯性。
研究表明,AI生成的文章通常品質較低,尤其是在涉及複雜主題時。儘管AI可以快速產生大量內容,但這些內容往往缺乏深度和準確性。例如,在一些條目中出現了明顯的錯誤,例如引用與主題無關的資料。此外,AI生成的文本可能包含情緒化或不中立的表述,這與維基百科對中立性和可驗證性的要求相反。
為了因應AI生成內容帶來的挑戰,維基百科成立了名為 WikiProject AI Cleanup 的項目,專門負責辨識和清理低品質的AI產生內容。這項計畫旨在保護維基百科的資訊庫免受誤導性內容的影響,並確保條目的準確性和可靠性。編輯們透過辨識常見的AI生成短語和風格來快速定位問題內容。
儘管AI在內容生成方面展現出潛力,但它並不能完全取代人類編輯。人類編輯在確保資訊準確性、深度和中立性方面仍然發揮著不可或缺的作用。 AI可以作為輔助工具來提高編輯效率,但最終仍需依賴人類進行審查和修正,以確保維基百科的高品質標準得以維持。