本文翻譯自《Scientific Reprots》出版於 2024/11/4 的研究,該份研究主要由匹茲堡大學(University of Pittsburgh)科學史與科學哲學系(Department of History and Philosophy of Science)的教授 Brian Porter 和 Edouard Machery 所主持的項目。
𝑨𝑰-𝒈𝒆𝒏𝒆𝒓𝒂𝒕𝒆𝒅 𝒑𝒐𝒆𝒕𝒓𝒚 𝒊𝒔 𝒊𝒏𝒅𝒊𝒔𝒕𝒊𝒏𝒈𝒖𝒊𝒔𝒉𝒂𝒃𝒍𝒆 𝒇𝒓𝒐𝒎 𝒉𝒖𝒎𝒂𝒏-𝒘𝒓𝒊𝒕𝒕𝒆𝒏 𝒑𝒐𝒆𝒕𝒓𝒚 𝒂𝒏𝒅 𝒊𝒔 𝒓𝒂𝒕𝒆𝒅 𝒎𝒐𝒓𝒆 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒚
現今,非專業讀者幾乎無法區分人類詩人和人工智慧生成的詩歌。
研究發現,參與者認為 AI 生成的詩為人類作品的機率,比真正人類作品還要高。造成此現象的部分原因是,人們普遍認為 AI 無法創作出高品質詩歌,因此當他們遇到喜歡的詩時,便誤認為那是人類的作品。
-
本研究使用 ChatGPT 3.5 模型生成詩歌。
研究人員採用「人類排除」的模式,也就是說,除了提供「以詩人的風格寫一首短詩」的指示之外,沒有對模型進行任何微調或從多首詩中選擇最佳作品。模型生成的前五首詩直接被用於研究。
研究人員選擇了 10 位英語詩人,涵蓋了廣泛的流派、風格和時期,包括:
他們從線上詩歌數據庫 mypoeticside.com 收集了每位詩人的五首詩,並使用 ChatGPT 3.5 模仿每位詩人的風格生成了五首詩。
值得注意的是,研究人員並沒有詳細說明 ChatGPT 3.5 模型如何生成詩歌的具體技術細節。 例如:他們沒有說明模型使用了哪些訓練數據、使用了哪些算法、模型的架構是什麼等等。
-
該份研究主要有三個發現值得參考,分別為:辨識能力低於機率水平、AI 詩歌更受青睞、先入為主的偏差。以下將逐項介紹。
在第一項實驗中,參與者幾乎無法區分 AI 生成的詩歌與著名詩人的創作。
參與者辨識 AI 生成詩歌的準確率為 46.6%,隨機擲硬幣猜答案都比較高,顯示一般大眾在區分 AI 與人類詩歌方面存在顯著困難。
在多數評比類目上,AI 生成詩歌的得分顯著高於人類詩歌,例如:節奏感(rhythm)、美感(beautiful)、意境(imagery)傳達等。特別是,AI 詩歌被評為「更具節奏感」,這一指標在各項評分中表現尤為突出。
當參與者得知詩歌由 AI 生成時,他們的評價普遍偏低;反之,當被告知詩歌由人類創作時,評價則提高。然而,在不提供任何資訊的情況下,參與者更傾向認為 AI 詩歌是人類創作。
作者認為,AI 生成詩歌開始出現的「比人類更像人類」現象,源於讀者對於 AI 能力的誤解,以及自身審美偏好的影響。
讀者通常期望人類詩歌更能引起共鳴,但實際上他們卻更容易理解 AI 詩歌所傳達的意象、主題和情感。這種理解上的差異,導致讀者誤將 AI 詩歌歸類為人類作品。
此外,詩歌作為文學創作的一部分,其創作過程本身蘊含的意義和價值值得深思。兩位作者都呼籲:在大力推廣生成式 AI 的同時,應平衡科技進步與人類創作獨特性的維護。
作者也提到,隨著 AI 生成模型的演進,人們對於「聽起來像人類」的詩歌標準也可能隨之改變。 例如,過去 GPT-2 生成的詩歌還可以與人類作品區分,但現在 ChatGPT 3.5 生成的詩歌已經難以辨別。