vocus logo

方格子 vocus

AI 認為「雪」= 狼(資料集偏見)

更新 發佈閱讀 3 分鐘

⭐ 事件

研究者發現分類器:

👉 狼 vs 哈士奇 準確率很高

但用 saliency map 看:

👉 模型其實在看「雪」

原因:

👉 狼照片多在雪地

👉 哈士奇照片多在室內

🎯 意義

這案例成為:

👉 dataset bias 經典教材

結論:

AI 可能在解錯問題,但仍給對答案


這是機器學習史上最經典的「資料集偏見(dataset bias)」案例之一。

它揭示了一件殘酷的事:

模型學到的,往往不是你以為它在學的東西。


🐺❄️ AI 認為「雪」= 狼

raw-image

📜 事件背景

約 2016–2017 年,一位工程師訓練一個簡單 CNN 模型來區分:

  • 🐺 Wolf(狼)
  • 🐶 Husky(哈士奇)

訓練準確率很高(>90%)。

看起來模型成功學會辨識兩種動物。


🔍 問題出現

當研究者使用 解釋工具(如 Grad-CAM) 查看模型「在看哪裡」時,發現:

👉 模型注意力集中在 背景的雪地

而不是:

  • 臉部
  • 耳朵
  • 毛色
  • 身體形狀

🎯 真正發生的事

資料集中:

  • 狼圖片大多來自自然野外(有雪)
  • 哈士奇圖片多為家庭寵物(無雪)

因此模型實際學到的是:

如果有雪 → 很可能是狼
如果沒有雪 → 很可能是哈士奇

而不是:

學會狼與狗的形態差異


🧠 為何會這樣?

① 統計捷徑(shortcut learning)

神經網路的目標只有一個:

最小化 loss

如果「雪」這個特徵:

  • 容易辨識
  • 高相關
  • 計算成本低

模型自然會使用它。


② 相關 ≠ 因果

模型學的是:

  • correlation(相關性)

不是:

  • causation(因果)

它不知道:

狼本質不是雪


③ 高維特徵偏好

CNN 對:

  • texture
  • 局部 pattern

高度敏感。

背景比主體:

  • 更穩定
  • 更一致
  • 更容易捕捉

🔬 這個案例的影響

這成為:

dataset bias 教科書級案例

推動了:

  • fairness research
  • domain generalization
  • causal representation learning
  • robust vision

🧊 延伸案例

類似錯誤包括:

  • 醫療模型用醫院水印判斷疾病
  • 貧窮預測模型用夜間燈光
  • 自駕車模型用天空顏色推測場景

👉 模型會抓「最容易的特徵」


💥 深層哲學衝擊

這個案例讓研究者意識到:

高準確率 ≠ 正確理解

AI 的成功可能是:

  • 偶然共現
  • 環境偏見
  • 資料分佈錯誤

⭐ 一句話總結

AI 認為「雪」= 狼,說明模型學到的是資料的統計偏見,而非世界的本質。



留言
avatar-img
sirius數字沙龍
8會員
203內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/02/27
🛑 貼紙攻擊 → 自駕車看不見 STOP 這是對抗樣本史上最著名的物理世界案例之一。 它證明: 只要貼幾張貼紙,就能讓 AI 交通標誌辨識失效。 📜 事件背景 2017 年,研究團隊發表論文: Robust Physical-World Attacks on Deep Learni
Thumbnail
2026/02/27
🛑 貼紙攻擊 → 自駕車看不見 STOP 這是對抗樣本史上最著名的物理世界案例之一。 它證明: 只要貼幾張貼紙,就能讓 AI 交通標誌辨識失效。 📜 事件背景 2017 年,研究團隊發表論文: Robust Physical-World Attacks on Deep Learni
Thumbnail
2026/02/27
AI 發展史中,其實充滿了被騙、誤判、幻覺與行為失控的案例。 這些事件不只好笑,很多還直接影響 AI 安全研究方向。 這是 AI 史上最震撼的實驗之一。 它讓整個深度學習社群第一次真正意識到: 神經網路「看到的世界」和人類完全不同。 🐢 AI 看到烏龜 → 認成步槍 📜 事件背景
Thumbnail
2026/02/27
AI 發展史中,其實充滿了被騙、誤判、幻覺與行為失控的案例。 這些事件不只好笑,很多還直接影響 AI 安全研究方向。 這是 AI 史上最震撼的實驗之一。 它讓整個深度學習社群第一次真正意識到: 神經網路「看到的世界」和人類完全不同。 🐢 AI 看到烏龜 → 認成步槍 📜 事件背景
Thumbnail
2026/02/27
2016 年: AlphaGo 對戰 Lee Sedol 第 37 手: 👉 下出極不自然位置 👉 人類以為是失誤 👉 卻成為勝負手 被稱為: 神之一手 🎯 有趣點 👉 AI 不只是算力 👉 而是策略空間探索 很多棋手描述: 👉 這手改變他們對圍棋美學的理解
Thumbnail
2026/02/27
2016 年: AlphaGo 對戰 Lee Sedol 第 37 手: 👉 下出極不自然位置 👉 人類以為是失誤 👉 卻成為勝負手 被稱為: 神之一手 🎯 有趣點 👉 AI 不只是算力 👉 而是策略空間探索 很多棋手描述: 👉 這手改變他們對圍棋美學的理解
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
德州大學奧斯汀分校與北卡州立大合作,開發一款能「連續量血壓」的智慧手錶原型。它不用傳統袖帶,而是透過生物阻抗與 RF 訊號監測血壓,再用機器學習推算,目標做到臨床級準確度。這項技術從 2022 電子刺青延伸而來,被期待成為未來穿戴醫療的重要突破。
Thumbnail
德州大學奧斯汀分校與北卡州立大合作,開發一款能「連續量血壓」的智慧手錶原型。它不用傳統袖帶,而是透過生物阻抗與 RF 訊號監測血壓,再用機器學習推算,目標做到臨床級準確度。這項技術從 2022 電子刺青延伸而來,被期待成為未來穿戴醫療的重要突破。
Thumbnail
【世界首場機器人馬拉松】 「2025北京亦莊半程馬拉松暨人形機器人半程馬拉松」2025年4月19日登場,除了約1.2萬的人類參加,還有約20支機器人團隊參加。 參賽機器人出現各種狀況,例如摔倒、掉頭、散架、走錯方向、跑得太緩慢等狀況。
Thumbnail
【世界首場機器人馬拉松】 「2025北京亦莊半程馬拉松暨人形機器人半程馬拉松」2025年4月19日登場,除了約1.2萬的人類參加,還有約20支機器人團隊參加。 參賽機器人出現各種狀況,例如摔倒、掉頭、散架、走錯方向、跑得太緩慢等狀況。
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
Sequential Feature Selection(SFS) 用中文來解釋為,逐一特徵選取訓練,找出最重要的特徵,以提高模型的性能和效率 SFS 的一些用途包括: 維度縮減: 在高維度數據中,許多特徵可能是多餘或不重要的,使用 SFS 可以找到最能代表數據的特徵,從而減少計算和記憶體需求
Thumbnail
Sequential Feature Selection(SFS) 用中文來解釋為,逐一特徵選取訓練,找出最重要的特徵,以提高模型的性能和效率 SFS 的一些用途包括: 維度縮減: 在高維度數據中,許多特徵可能是多餘或不重要的,使用 SFS 可以找到最能代表數據的特徵,從而減少計算和記憶體需求
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News