當人的細緻差異被AI「數據平滑化」

更新 發佈閱讀 2 分鐘

最近參與某專案的過程,接觸到AI訓練資料的標註。簡單來說,就是閱讀一些文本,人工判斷文章的立場和想傳達的訊息。

為了比對人工標註和AI標註的差別,我先自己標註一次,再請AI標註同樣的內容。結果發現,AI標註的結果沒錯,但會省略、合併某些很細微的文字線索,而些微的文字差異,就可能對訊息判讀產生關鍵的差異。

以香菜為例,舉個例子說明:

A:在美食專家眼中,香菜「極可能被認定為」台灣小吃的靈魂。

B:對一些美食專家而言,香菜「可能是」台灣小吃的靈魂。

在人工標註時,我可以很直覺的區辨兩句話訊息並不完全相等,前者對推廣香菜有滿滿的愛,後者更像是帶有距離的客觀陳述。如果再考量到A和B所刊載的媒體差異,A是一本推廣香菜的農產雜誌,B是一本寫給一般大眾的美食雜誌,箇中差異就更加明顯。

但詢問ChatGPT和Gemini,如果沒有特別給提示,對通用型AI語言模型而言,這兩則訊息的立場基本上會被判別為相同。

在深入探究這種差異的過程,我學會了一個名詞,叫「資料平滑化」(data smoothing)。統計學在處理資料的過程中,會將和平均值差異較大的離群值視為干擾的「雜訊」,並將之移除,以便掌握長期趨勢。

人文社科領域的文本資料具有高度岐異性,閱讀、詮釋,高度仰賴上下文情境以及文本之外的社會脈絡,當AI以處理數據的邏輯處理承載人類充滿情感、立場、慾望的文本,可以想見其間細緻的差異也會被「平滑化」。於是我們得到愈來愈無聊、愈來愈平均的AI創作。

越是理解AI,就越是感到人的價值與珍貴。

留言
avatar-img
留言分享你的想法!
avatar-img
Money Talks
27會員
86內容數
會算塔羅牌,也會算資產報酬率,沒有人規定不能兩樣都會。科技冷冷的,可是筆下的AI卻會在凌晨陪人說話。對錢不貪,卻總想搞懂它的規則;對人不多話,卻能寫出一段又一段別人不敢說的心事。 (以上簡介由AI生成) 有事來信:gracechronicle@gmail.com
Money Talks的其他內容
2025/11/23
社會學家馬克思說資本主義使人異化,「工人和他們的勞動成果從此毫無關聯」。勞動結果的歸屬、用途,都與工人無關,他們只是一個口令一個動作的執行者。AI出現以後,知識工作者的異化感只會更強烈。
2025/11/23
社會學家馬克思說資本主義使人異化,「工人和他們的勞動成果從此毫無關聯」。勞動結果的歸屬、用途,都與工人無關,他們只是一個口令一個動作的執行者。AI出現以後,知識工作者的異化感只會更強烈。
2025/11/15
2025/11/15
2025/11/08
當AI開始用AI生成的資料學習,人類的創造力將再次成為最稀缺的資源。
2025/11/08
當AI開始用AI生成的資料學習,人類的創造力將再次成為最稀缺的資源。
看更多
你可能也想看
Thumbnail
這篇文章記錄了我與香氛品牌 Sunkronizo 的相遇,用氣味重新校準生活的節奏。 從前調的水底靜謐,到中調的貼膚潔淨,再到基調的安穩木質,每一層都像在提醒自己:慢下來、呼吸、同步。 Silent Wild 對我來說,是一種存在方式的註記,也是我日常裡的小小儀式。
Thumbnail
這篇文章記錄了我與香氛品牌 Sunkronizo 的相遇,用氣味重新校準生活的節奏。 從前調的水底靜謐,到中調的貼膚潔淨,再到基調的安穩木質,每一層都像在提醒自己:慢下來、呼吸、同步。 Silent Wild 對我來說,是一種存在方式的註記,也是我日常裡的小小儀式。
Thumbnail
前言:信仰動搖的 72 小時 嗨,我是法鬥先生。 如果你是我的老讀者,一定知道我過去是 ChatGPT 的鐵桿粉絲。從 Plus 版剛出我就第一時間訂閱,它的邏輯能力和 DALL-E 3 繪圖一直是我工作的核心。我曾以為,Google 在這場 AI 大戰中已經落後太遠,只能當個陪跑者。 但這幾
Thumbnail
前言:信仰動搖的 72 小時 嗨,我是法鬥先生。 如果你是我的老讀者,一定知道我過去是 ChatGPT 的鐵桿粉絲。從 Plus 版剛出我就第一時間訂閱,它的邏輯能力和 DALL-E 3 繪圖一直是我工作的核心。我曾以為,Google 在這場 AI 大戰中已經落後太遠,只能當個陪跑者。 但這幾
Thumbnail
近年來,ChatGPT快速成為全球熱門的文字生成工具,無論是撰寫文章、擬定策略,甚至創作故事,都展現出強大的語言能力。然而,許多使用者也發現,這款人工智慧在數學運算上經常出錯,為何AI在文字表現出色,卻在數字推理上失準?
Thumbnail
近年來,ChatGPT快速成為全球熱門的文字生成工具,無論是撰寫文章、擬定策略,甚至創作故事,都展現出強大的語言能力。然而,許多使用者也發現,這款人工智慧在數學運算上經常出錯,為何AI在文字表現出色,卻在數字推理上失準?
Thumbnail
「良師益友GPT」改版與提示詞開源 不諂媚用戶的「良師益友GPT」推出後至今, 很高興地累積了300則以上的對話。 也收到一些有建設性的反饋。 ​ 這裡統一回應收到的反饋。 反饋大致上有兩種類型: ​ ▋1.不認同這種AI性格的存在意義 沒有人愛聽說教。覺得怎麼有人跟AI對話是想討
Thumbnail
「良師益友GPT」改版與提示詞開源 不諂媚用戶的「良師益友GPT」推出後至今, 很高興地累積了300則以上的對話。 也收到一些有建設性的反饋。 ​ 這裡統一回應收到的反饋。 反饋大致上有兩種類型: ​ ▋1.不認同這種AI性格的存在意義 沒有人愛聽說教。覺得怎麼有人跟AI對話是想討
Thumbnail
什麼是 Vibe Coding?從概念到實踐 Vibe Coding 是一種新興的程式設計方式,核心理念是「用自然語言與 AI 對話,讓 AI 幫你寫程式」。這個概念由知名電腦科學家 Andrej Karpathy 提出,他認為未來最重要的程式語言是英文。
Thumbnail
什麼是 Vibe Coding?從概念到實踐 Vibe Coding 是一種新興的程式設計方式,核心理念是「用自然語言與 AI 對話,讓 AI 幫你寫程式」。這個概念由知名電腦科學家 Andrej Karpathy 提出,他認為未來最重要的程式語言是英文。
Thumbnail
個人的統獨立場是妨礙政治討論的因素之一。 但我認為,若是AI來分析的話, 相對性的,可以產出比你我還更中立客觀的論點。 (當然,有訓練資料的局限性,不可能100%中立)
Thumbnail
個人的統獨立場是妨礙政治討論的因素之一。 但我認為,若是AI來分析的話, 相對性的,可以產出比你我還更中立客觀的論點。 (當然,有訓練資料的局限性,不可能100%中立)
Thumbnail
Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新,涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。
Thumbnail
Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新,涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。
Thumbnail
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News