模糊的,與愈加模糊的AI生成內容

前圖紙-avatar-img
發佈於哲學研究 個房間
更新 發佈閱讀 5 分鐘

〈模糊的,與愈加模糊的AI生成內容〉2025-10-29

 

  昨天在社群上看到一篇有趣的文章,作者用哈布斯堡王朝(Habsburg dynasty)的近親通婚,比喻AI大量使用AI合成資料作為訓練資料可能造成的毀滅性後果。

 

  這篇文章有著吸引眼球的譬喻,內容也具有啟發性和發人深省,但近親通婚可能的疾病問題和AI大量使用合成資料畢竟不是相同的科學原理,我想從另一個角度,重新聊聊大量使用合成資料的問題。

 

有損壓縮與難以辨識的錯誤

   2023年初,令人敬佩的科幻作家姜峯楠(Ted Chiang)在《紐約客》上發表了一篇--關於大型語言生成模型--極具洞見的文章《ChatGPT 是網路的一張模糊 JPEG 圖像》(ChatGPT Is a Blurry JPEG of the Web)。

 

  這篇文章從Xerox影印機在2014某次更新時修復掉的一個漏洞說起。2013年,一間德國建築公司的工人注意到他們影印機上出現的一個怪問題:當時,他們打算影印一間房子的平面圖。在原始版本的平面圖中,房子的三個房間都是長方形的,面積分別為14.13、21.11和17.42平方公尺。然而,在影印出來的文件裡,三個房間都被標記為14.13平方公尺。

 

  對於早期的物理靜電印刷來說,這件詭異的事情是不可能發生的。然而,現代的Xerox影印機,已經開始使用數位掃描,機器會對掃描的文件進行編碼、壓縮,之後再重新解碼、影印出來。

 

  為了節省空間,影印機「聰明地」將那些標示房間面積的標籤判讀為足夠相似,所以它只儲存了其中一個資料「14.13」,並在列印平面圖的那一刻,對所有房間重複使用這個它儲存起來的標籤。

 

  這個漏洞導致了一件嚴重的問題:壓縮帶來的失真,有時無法被立即地辨認出來。如果影印機印出的是一張模糊的文件,每個人都可以立即看出它不是原件的準確複製品。但這個漏洞造成的結果是:文件看起來很清楚,機器生成出來的數字完全是可讀的。這使得文件看起來很準確,即便它實際上完全錯誤。

 

  在姜峯楠的比喻中,他希望我們思考的問題是,語言模型幫我們把知識「壓縮」成那些AI文章時,它是否讓一些重要的東西在過程中損失了?而且更糟糕的問題是,我們很可能無法即時辨識出來,我們面前的這些內容早已是如那張「平面圖影本」一樣的非真相。

 

反覆自我消磨,直到王朝終結

   那篇網路文章談論的問題核心與此相關。如果AI會在每一次資料生成的過程中,都做一次消除多樣性的「平滑修飾」。那麼,當AI開始大量使用AI生成內容當作訓練資料,它生成的內容就會愈加平庸且無聊。

 

  所有如「房間大小」這樣可能極為重要的細微差異,都會在一次又一次的反芻中被磨平。獨特的觀點、冷門的知識、有特色的寫作風格……也都會在「反覆修飾」之後,變得主流、無害、對誰都理所當然。

 

  同時,其中任何一次重大錯誤,都會在過程中如謠言那樣逐漸放大、定型。且隨著這些AI內容被大量生產,在一個冷門主題上,錯誤內容可能會劣幣驅逐良幣,最終讓事實被網路遺忘,幻覺成為了AI搜尋引擎中唯一能夠被找到的「真相」。

 

  這些AI自我參照可能發生的問題,就像哈布斯堡家族成員血液中,那些有害的隱性基因,在不斷自我放大的過程中,無可避免地造成悲劇性的後果。

 

  不過,就算你不認為語言模型的進程會走向那種毀滅性的極端情況,現在仍是一個好時間,讓我們重新去探問AI生成內容的應用(或者說「透過AI認識世界」)對當前人類的益處到底是什麼?

 

  在兩年多前那篇文章的最後,姜峯楠問了這樣一個問題:

 

  當我們能夠取得關於世界的「真實原件」時,像AI生成內容這樣,總是讓部分內容一次又一次遺失、讓我們所見所得變得模糊的東西,對我們有多大的用處呢?



延伸閱讀:
〈「去人類化」工具不會讓世界變得更美好:談姜峯楠〈為什麼人工智慧不會創造藝術〉〉
〈胡塞爾和柏拉圖會怎麼用AI?--AI輔助寫作與「自己的作品」〉
〈AI幻覺的成因與人類社會早就存在的「幻覺文化」〉
〈無品味的AI與如AI般空洞的人〉
〈Being-In-the-VVorld〉

留言
avatar-img
留言分享你的想法!
avatar-img
前圖紙的沙龍
117會員
1.0K內容數
一個寫作實踐,關於我看到和思考中的事情。
前圖紙的沙龍的其他內容
2025/10/26
  如果沒有時間的限制,我們不會急著讓美好的事情如煙火般短暫綻放,會更願意讓一切慢火熬煮,一邊更認識彼此,一邊才逐漸走近。   我們也可以投入學習每一件有趣的事情,享受每個難能可貴的當下。由於我們不趕時間,所以不必擔心,可以更加專注與仔細,也有更多做得沒那麼好後,慢慢修改雕琢的空間。
2025/10/26
  如果沒有時間的限制,我們不會急著讓美好的事情如煙火般短暫綻放,會更願意讓一切慢火熬煮,一邊更認識彼此,一邊才逐漸走近。   我們也可以投入學習每一件有趣的事情,享受每個難能可貴的當下。由於我們不趕時間,所以不必擔心,可以更加專注與仔細,也有更多做得沒那麼好後,慢慢修改雕琢的空間。
2025/10/07
  將它重新排列為由大到小與由小到大兩個數字後,將它們彼此相減。譬如把4537排成7543和3457,然後計算「7543-3457」,將得到的數再做一樣的操作。持續減下去,你會發現,在7次計算之內,你會抵達「6174」,而且由於7641-1467=6174,數字會卡在6174不再動彈。
2025/10/07
  將它重新排列為由大到小與由小到大兩個數字後,將它們彼此相減。譬如把4537排成7543和3457,然後計算「7543-3457」,將得到的數再做一樣的操作。持續減下去,你會發現,在7次計算之內,你會抵達「6174」,而且由於7641-1467=6174,數字會卡在6174不再動彈。
2025/10/04
  在安排逐漸增加的跑步菜單時,我也看準了一場九月的馬拉松比賽,希望能在幾個月的練習之後,可以試著跑跑看半馬。兩週前,那場比賽結束了,但相較於「達成目標的喜悅」,我得到的是「一次有趣且有成就感的經驗」以及「那麼,接下來呢?」的自我追問。
2025/10/04
  在安排逐漸增加的跑步菜單時,我也看準了一場九月的馬拉松比賽,希望能在幾個月的練習之後,可以試著跑跑看半馬。兩週前,那場比賽結束了,但相較於「達成目標的喜悅」,我得到的是「一次有趣且有成就感的經驗」以及「那麼,接下來呢?」的自我追問。
看更多
你可能也想看
Thumbnail
用 AI 製作一張專屬巴黎奧運的紀念海報吧~
Thumbnail
用 AI 製作一張專屬巴黎奧運的紀念海報吧~
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News