模糊的,與愈加模糊的AI生成內容

前圖紙-avatar-img
發佈於哲學研究 個房間
更新 發佈閱讀 5 分鐘

〈模糊的,與愈加模糊的AI生成內容〉2025-10-29

 

  昨天在社群上看到一篇有趣的文章,作者用哈布斯堡王朝(Habsburg dynasty)的近親通婚,比喻AI大量使用AI合成資料作為訓練資料可能造成的毀滅性後果。

 

  這篇文章有著吸引眼球的譬喻,內容也具有啟發性和發人深省,但近親通婚可能的疾病問題和AI大量使用合成資料畢竟不是相同的科學原理,我想從另一個角度,重新聊聊大量使用合成資料的問題。

 

有損壓縮與難以辨識的錯誤

   2023年初,令人敬佩的科幻作家姜峯楠(Ted Chiang)在《紐約客》上發表了一篇--關於大型語言生成模型--極具洞見的文章《ChatGPT 是網路的一張模糊 JPEG 圖像》(ChatGPT Is a Blurry JPEG of the Web)。

 

  這篇文章從Xerox影印機在2014某次更新時修復掉的一個漏洞說起。2013年,一間德國建築公司的工人注意到他們影印機上出現的一個怪問題:當時,他們打算影印一間房子的平面圖。在原始版本的平面圖中,房子的三個房間都是長方形的,面積分別為14.13、21.11和17.42平方公尺。然而,在影印出來的文件裡,三個房間都被標記為14.13平方公尺。

 

  對於早期的物理靜電印刷來說,這件詭異的事情是不可能發生的。然而,現代的Xerox影印機,已經開始使用數位掃描,機器會對掃描的文件進行編碼、壓縮,之後再重新解碼、影印出來。

 

  為了節省空間,影印機「聰明地」將那些標示房間面積的標籤判讀為足夠相似,所以它只儲存了其中一個資料「14.13」,並在列印平面圖的那一刻,對所有房間重複使用這個它儲存起來的標籤。

 

  這個漏洞導致了一件嚴重的問題:壓縮帶來的失真,有時無法被立即地辨認出來。如果影印機印出的是一張模糊的文件,每個人都可以立即看出它不是原件的準確複製品。但這個漏洞造成的結果是:文件看起來很清楚,機器生成出來的數字完全是可讀的。這使得文件看起來很準確,即便它實際上完全錯誤。

 

  在姜峯楠的比喻中,他希望我們思考的問題是,語言模型幫我們把知識「壓縮」成那些AI文章時,它是否讓一些重要的東西在過程中損失了?而且更糟糕的問題是,我們很可能無法即時辨識出來,我們面前的這些內容早已是如那張「平面圖影本」一樣的非真相。

 

反覆自我消磨,直到王朝終結

   那篇網路文章談論的問題核心與此相關。如果AI會在每一次資料生成的過程中,都做一次消除多樣性的「平滑修飾」。那麼,當AI開始大量使用AI生成內容當作訓練資料,它生成的內容就會愈加平庸且無聊。

 

  所有如「房間大小」這樣可能極為重要的細微差異,都會在一次又一次的反芻中被磨平。獨特的觀點、冷門的知識、有特色的寫作風格……也都會在「反覆修飾」之後,變得主流、無害、對誰都理所當然。

 

  同時,其中任何一次重大錯誤,都會在過程中如謠言那樣逐漸放大、定型。且隨著這些AI內容被大量生產,在一個冷門主題上,錯誤內容可能會劣幣驅逐良幣,最終讓事實被網路遺忘,幻覺成為了AI搜尋引擎中唯一能夠被找到的「真相」。

 

  這些AI自我參照可能發生的問題,就像哈布斯堡家族成員血液中,那些有害的隱性基因,在不斷自我放大的過程中,無可避免地造成悲劇性的後果。

 

  不過,就算你不認為語言模型的進程會走向那種毀滅性的極端情況,現在仍是一個好時間,讓我們重新去探問AI生成內容的應用(或者說「透過AI認識世界」)對當前人類的益處到底是什麼?

 

  在兩年多前那篇文章的最後,姜峯楠問了這樣一個問題:

 

  當我們能夠取得關於世界的「真實原件」時,像AI生成內容這樣,總是讓部分內容一次又一次遺失、讓我們所見所得變得模糊的東西,對我們有多大的用處呢?



延伸閱讀:
〈「去人類化」工具不會讓世界變得更美好:談姜峯楠〈為什麼人工智慧不會創造藝術〉〉
〈胡塞爾和柏拉圖會怎麼用AI?--AI輔助寫作與「自己的作品」〉
〈AI幻覺的成因與人類社會早就存在的「幻覺文化」〉
〈無品味的AI與如AI般空洞的人〉
〈Being-In-the-VVorld〉

留言
avatar-img
前圖紙的沙龍
128會員
1.1K內容數
一個寫作實踐,關於我看到和思考中的事情。
前圖紙的沙龍的其他內容
2025/10/26
  如果沒有時間的限制,我們不會急著讓美好的事情如煙火般短暫綻放,會更願意讓一切慢火熬煮,一邊更認識彼此,一邊才逐漸走近。   我們也可以投入學習每一件有趣的事情,享受每個難能可貴的當下。由於我們不趕時間,所以不必擔心,可以更加專注與仔細,也有更多做得沒那麼好後,慢慢修改雕琢的空間。
2025/10/26
  如果沒有時間的限制,我們不會急著讓美好的事情如煙火般短暫綻放,會更願意讓一切慢火熬煮,一邊更認識彼此,一邊才逐漸走近。   我們也可以投入學習每一件有趣的事情,享受每個難能可貴的當下。由於我們不趕時間,所以不必擔心,可以更加專注與仔細,也有更多做得沒那麼好後,慢慢修改雕琢的空間。
2025/10/07
  將它重新排列為由大到小與由小到大兩個數字後,將它們彼此相減。譬如把4537排成7543和3457,然後計算「7543-3457」,將得到的數再做一樣的操作。持續減下去,你會發現,在7次計算之內,你會抵達「6174」,而且由於7641-1467=6174,數字會卡在6174不再動彈。
2025/10/07
  將它重新排列為由大到小與由小到大兩個數字後,將它們彼此相減。譬如把4537排成7543和3457,然後計算「7543-3457」,將得到的數再做一樣的操作。持續減下去,你會發現,在7次計算之內,你會抵達「6174」,而且由於7641-1467=6174,數字會卡在6174不再動彈。
2025/10/04
  在安排逐漸增加的跑步菜單時,我也看準了一場九月的馬拉松比賽,希望能在幾個月的練習之後,可以試著跑跑看半馬。兩週前,那場比賽結束了,但相較於「達成目標的喜悅」,我得到的是「一次有趣且有成就感的經驗」以及「那麼,接下來呢?」的自我追問。
2025/10/04
  在安排逐漸增加的跑步菜單時,我也看準了一場九月的馬拉松比賽,希望能在幾個月的練習之後,可以試著跑跑看半馬。兩週前,那場比賽結束了,但相較於「達成目標的喜悅」,我得到的是「一次有趣且有成就感的經驗」以及「那麼,接下來呢?」的自我追問。
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
用 AI 製作一張專屬巴黎奧運的紀念海報吧~
Thumbnail
用 AI 製作一張專屬巴黎奧運的紀念海報吧~
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
Thumbnail
上週末的英國格拉斯哥也出現了類似的慘案,一家公司用AI繪圖,製作了非常華麗的活動海報....
Thumbnail
上週末的英國格拉斯哥也出現了類似的慘案,一家公司用AI繪圖,製作了非常華麗的活動海報....
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News