當人的細緻差異被AI「數據平滑化」

發佈於科技業打工日記

2025/11/30 更新2025/11/30 發佈閱讀 2 分鐘

最近參與某專案的過程，接觸到AI訓練資料的標註。簡單來說，就是閱讀一些文本，人工判斷文章的立場和想傳達的訊息。

為了比對人工標註和AI標註的差別，我先自己標註一次，再請AI標註同樣的內容。結果發現，AI標註的結果沒錯，但會省略、合併某些很細微的文字線索，而些微的文字差異，就可能對訊息判讀產生關鍵的差異。

以香菜為例，舉個例子說明：

A：在美食專家眼中，香菜「極可能被認定為」台灣小吃的靈魂。

B：對一些美食專家而言，香菜「可能是」台灣小吃的靈魂。

在人工標註時，我可以很直覺的區辨兩句話訊息並不完全相等，前者對推廣香菜有滿滿的愛，後者更像是帶有距離的客觀陳述。如果再考量到A和B所刊載的媒體差異，A是一本推廣香菜的農產雜誌，B是一本寫給一般大眾的美食雜誌，箇中差異就更加明顯。

但詢問ChatGPT和Gemini，如果沒有特別給提示，對通用型AI語言模型而言，這兩則訊息的立場基本上會被判別為相同。

在深入探究這種差異的過程，我學會了一個名詞，叫「資料平滑化」（data smoothing）。統計學在處理資料的過程中，會將和平均值差異較大的離群值視為干擾的「雜訊」，並將之移除，以便掌握長期趨勢。

人文社科領域的文本資料具有高度岐異性，閱讀、詮釋，高度仰賴上下文情境以及文本之外的社會脈絡，當AI以處理數據的邏輯處理承載人類充滿情感、立場、慾望的文本，可以想見其間細緻的差異也會被「平滑化」。於是我們得到愈來愈無聊、愈來愈平均的AI創作。

越是理解AI，就越是感到人的價值與珍貴。

Money Talks科技業打工日記

留言

Money Talks

33會員

99內容數

做過熟齡媒體記者、科技業公關。喜歡把複雜的事情講得簡單清楚，有時候有趣地講清楚。那件「複雜的事情」隨時間演變，曾經是退休投資、是個人長期健康管理，現在是AI應用新知、職場運作邏輯。另外也寫小說。信箱：gracechronicle@gmail.com

Money Talks的其他內容

2025/11/23

Google Gemini3 Pro發布的那天，我一個功能都沒試，卻做了很多家事

社會學家馬克思說資本主義使人異化，「工人和他們的勞動成果從此毫無關聯」。勞動結果的歸屬、用途，都與工人無關，他們只是一個口令一個動作的執行者。AI出現以後，知識工作者的異化感只會更強烈。

2025/11/23

Google Gemini3 Pro發布的那天，我一個功能都沒試，卻做了很多家事

社會學家馬克思說資本主義使人異化，「工人和他們的勞動成果從此毫無關聯」。勞動結果的歸屬、用途，都與工人無關，他們只是一個口令一個動作的執行者。AI出現以後，知識工作者的異化感只會更強烈。

2025/11/15

當你寧可跟狗講話也不想聊天：I人的職場社交焦慮應對法則

不知道該說什麼的時候，你可以聽。

2025/11/15

當你寧可跟狗講話也不想聊天：I人的職場社交焦慮應對法則

不知道該說什麼的時候，你可以聽。

2025/11/08

「模型崩壞」的未來：當AI生成內容沒提升創造者效率，而是開始複製平庸

當AI開始用AI生成的資料學習，人類的創造力將再次成為最稀缺的資源。

2025/11/08

「模型崩壞」的未來：當AI生成內容沒提升創造者效率，而是開始複製平庸

當AI開始用AI生成的資料學習，人類的創造力將再次成為最稀缺的資源。

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

法鬥先生｜與你一起玩AI

Gemini 3 評價&深度實測｜Google 終於醒了？這 3 個關鍵差異，讓我動了退訂 ChatGPT 的念頭...

Google 帶著最新的 Gemini 3 模型殺回來了！這不是那種不痛不癢的小改版，而是一次「核彈級」的 Google AI 更新。為了驗證它是不是真的這麼神，我做了一個大膽的實驗：過去 72 小時，我強迫自己「封印」ChatGPT，把所有寫作、分析、繪圖的工作，全部移轉到 Gemini 3 上。

#Gemini3#GoogleGemini#BananaPro

2025/11/25

法鬥先生｜與你一起玩AI

Gemini 3 評價&深度實測｜Google 終於醒了？這 3 個關鍵差異，讓我動了退訂 ChatGPT 的念頭...

Google 帶著最新的 Gemini 3 模型殺回來了！這不是那種不痛不癢的小改版，而是一次「核彈級」的 Google AI 更新。為了驗證它是不是真的這麼神，我做了一個大膽的實驗：過去 72 小時，我強迫自己「封印」ChatGPT，把所有寫作、分析、繪圖的工作，全部移轉到 Gemini 3 上。

#Gemini3#GoogleGemini#BananaPro

2025/11/25

為何ChatGPT數學表現有限？專家解析AI生成式智慧與演算法差異

近年來，ChatGPT快速成為全球熱門的文字生成工具，無論是撰寫文章、擬定策略，甚至創作故事，都展現出強大的語言能力。然而，許多使用者也發現，這款人工智慧在數學運算上經常出錯，為何AI在文字表現出色，卻在數字推理上失準？

#ChatGPT#AI#生成

2025/10/27

為何ChatGPT數學表現有限？專家解析AI生成式智慧與演算法差異

近年來，ChatGPT快速成為全球熱門的文字生成工具，無論是撰寫文章、擬定策略，甚至創作故事，都展現出強大的語言能力。然而，許多使用者也發現，這款人工智慧在數學運算上經常出錯，為何AI在文字表現出色，卻在數字推理上失準？

#ChatGPT#AI#生成

2025/10/27

幻詠 Gen Ai Studio

「友直、友諒、友多聞」古老智慧與AI科技的融合

「良師益友GPT」改版與提示詞開源不諂媚用戶的「良師益友GPT」推出後至今，很高興地累積了300則以上的對話。也收到一些有建設性的反饋。這裡統一回應收到的反饋。反饋大致上有兩種類型： ▋1.不認同這種AI性格的存在意義沒有人愛聽說教。覺得怎麼有人跟AI對話是想討

#ChatGPT#gemini#生成式AI

2025/10/14

幻詠 Gen Ai Studio

「友直、友諒、友多聞」古老智慧與AI科技的融合

「良師益友GPT」改版與提示詞開源不諂媚用戶的「良師益友GPT」推出後至今，很高興地累積了300則以上的對話。也收到一些有建設性的反饋。這裡統一回應收到的反饋。反饋大致上有兩種類型： ▋1.不認同這種AI性格的存在意義沒有人愛聽說教。覺得怎麼有人跟AI對話是想討

#ChatGPT#gemini#生成式AI

2025/10/14

蝦仁藥師_臨床輕鬆學的沙龍

Vibe Coding 趨勢解析：新創、企業與開發者的轉型關鍵

什麼是 Vibe Coding？從概念到實踐 Vibe Coding 是一種新興的程式設計方式，核心理念是「用自然語言與 AI 對話，讓 AI 幫你寫程式」。這個概念由知名電腦科學家 Andrej Karpathy 提出，他認為未來最重要的程式語言是英文。

#軟體#程式#新創

2025/09/28

蝦仁藥師_臨床輕鬆學的沙龍

Vibe Coding 趨勢解析：新創、企業與開發者的轉型關鍵

什麼是 Vibe Coding？從概念到實踐 Vibe Coding 是一種新興的程式設計方式，核心理念是「用自然語言與 AI 對話，讓 AI 幫你寫程式」。這個概念由知名電腦科學家 Andrej Karpathy 提出，他認為未來最重要的程式語言是英文。

#軟體#程式#新創

2025/09/28

幻詠 Gen Ai Studio

以AI分析中國武統台灣的利益與風險

個人的統獨立場是妨礙政治討論的因素之一。但我認為，若是AI來分析的話，相對性的，可以產出比你我還更中立客觀的論點。 (當然，有訓練資料的局限性，不可能100%中立)

#武統台灣#中國#ChatGPT

2025/08/20

幻詠 Gen Ai Studio

以AI分析中國武統台灣的利益與風險

個人的統獨立場是妨礙政治討論的因素之一。但我認為，若是AI來分析的話，相對性的，可以產出比你我還更中立客觀的論點。 (當然，有訓練資料的局限性，不可能100%中立)

#武統台灣#中國#ChatGPT

2025/08/20

TN科技筆記(TechNotes)的沙龍

Google Gemini 2.5 系列模型更新：高效能與成本效益的持續突破

Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新，涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。

#AI#人工智慧#科技公司

2025/06/19

TN科技筆記(TechNotes)的沙龍

Google Gemini 2.5 系列模型更新：高效能與成本效益的持續突破

Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新，涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。

#AI#人工智慧#科技公司

2025/06/19

TN科技筆記(TechNotes)的沙龍

Gemini 2.5 Pro Preview 05-06 更新介紹：前端開發與多模態應用的領頭羊

Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06，似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現，以及多模態應用的突破，成為最新的AI焦點。

#人工智慧#AI#生成式AI

2025/05/07

TN科技筆記(TechNotes)的沙龍

Gemini 2.5 Pro Preview 05-06 更新介紹：前端開發與多模態應用的領頭羊

Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06，似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現，以及多模態應用的突破，成為最新的AI焦點。

#人工智慧#AI#生成式AI

2025/05/07

TN科技筆記(TechNotes)的沙龍

解鎖 Gemini Live 的 5 大功能：相機與螢幕分享讓生活更聰明

本文介紹 Google Gemini Live 的 5 大實用功能，透過相機與螢幕畫面分享，幫助用戶整理空間、激發創意、解決問題、優化購物體驗及提升技能。支援繁體中文的 Gemini Live 已於 Pixel 9 與 Samsung Galaxy S25 等裝置推出！

#人工智慧#AI#科技公司

2025/04/08

TN科技筆記(TechNotes)的沙龍

解鎖 Gemini Live 的 5 大功能：相機與螢幕分享讓生活更聰明

本文介紹 Google Gemini Live 的 5 大實用功能，透過相機與螢幕畫面分享，幫助用戶整理空間、激發創意、解決問題、優化購物體驗及提升技能。支援繁體中文的 Gemini Live 已於 Pixel 9 與 Samsung Galaxy S25 等裝置推出！

#人工智慧#AI#科技公司

2025/04/08

AI9STUDIO | AI創作 AI資訊

AI 與科技大事 | 馬斯克 Grok API開放公測，月送25美元 | Google Gemini 登陸 iPhone

馬斯克的xAI最近推出Grok API，這是一個基於自研大模型Grok的開發者接口，現在已開放公測，每月提供25美元的免費使用額度，吸引了許多開發者和企業參與。Grok API專注於語言理解和數據分析，支持多種應用開發，包括智能助手和自動化解決方案。

#ChatGPT#教學#學習

2024/11/18

AI9STUDIO | AI創作 AI資訊

AI 與科技大事 | 馬斯克 Grok API開放公測，月送25美元 | Google Gemini 登陸 iPhone

馬斯克的xAI最近推出Grok API，這是一個基於自研大模型Grok的開發者接口，現在已開放公測，每月提供25美元的免費使用額度，吸引了許多開發者和企業參與。Grok API專注於語言理解和數據分析，支持多種應用開發，包括智能助手和自動化解決方案。

#ChatGPT#教學#學習

2024/11/18

結心雜貨店-【正向溝通與銷售】沙龍

不可不知! Python與生成式 AI 對行銷領域的重大影響!

近年來，隨著人工智慧技術的快速發展，Python結合生成式AI正逐漸成為行銷領域的重要利器。對於行銷專業人士來說，這股趨勢更是值得關注和深入研究。 Python和AI將會為行銷領域帶來什麼改變？

#行銷#生成式AI#智慧財產權

2024/03/11

結心雜貨店-【正向溝通與銷售】沙龍

不可不知! Python與生成式 AI 對行銷領域的重大影響!

近年來，隨著人工智慧技術的快速發展，Python結合生成式AI正逐漸成為行銷領域的重要利器。對於行銷專業人士來說，這股趨勢更是值得關注和深入研究。 Python和AI將會為行銷領域帶來什麼改變？

#行銷#生成式AI#智慧財產權

2024/03/11

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News