方格子 vocus

【資料科學微知識】什麼是倖存者偏差？

2023/06/27 更新2023/06/27 發佈閱讀 3 分鐘

倖存者偏差（Survivorship bias）是一種認知偏差，指的是在觀察研究對象時，只關注了「倖存」或「成功」的部分，而忽略了已經「消失」或「失敗」的部分。

這種偏差通常發生在樣本不完整或有遺漏的情況下，而且容易導致對結果做出誤導性的評估或推論。

尤其AI的時代來臨，基石源自於數據，數據相當於燃料，經過一番統計運用之後才能夠聰明的理解我們的需求之後給予最貼近我們需要的答案，資料科學領域中最重視數據的佐證，但往往我們只看到表象而忽略了某些重要的關鍵因素，導致得出非正確的結論，造成偏差。

究竟誰對誰錯呢？

二戰的故事啟發

倖存者偏差最早起源於二戰時期的美國空軍對飛機損傷的研究，當時研究人員只研究了還能飛回來的飛機，並根據這些飛機的損傷部位提出了相應的補強建議。然而，這種研究卻忽略了已經被擊落的飛機，也就是失敗的一方。因此，研究的結果並不能完全代表整個飛機群體的損傷情況，可能會導致錯誤的結論。

研究人員根據戰鬥中回來的飛機進行分析，除了螺旋槳與駕駛艙之外，其它地方都佈滿了彈孔，就些彈孔分布的地方就成為了資料科學中統計的一個數據樣本。

而根據這些樣本，大部分軍方皆一致認為應該針對這些彈著點較多的地方進行加強，畢竟眼見為憑，事實的表象也讓我們直覺的認為應該如此決策，但此時統計學家卻獨排眾議，提出了不同的看法，認為應該要針對彈著點較少的地方進行防護。

那為什麼這會統計專家會得出這樣的結論呢？

從這個故事中我們觀察到，表面的證據並不能直接讓我們進行決策，假若我們單看倖存者而忽略了犧牲者時，便會導致結論偏向不正確的一方，在資料科學中也是如此，機器學習時若樣本數不足，或者未給予反面方的資料，很容易造成統計錯誤，進行推論出錯誤的決策。

結語

在其他領域，倖存者偏差也常常存在。例如，對於成功的企業家或投資者的研究，我們只看到他們的成功案例，卻忽略了那些失敗的案例。這樣容易產生錯誤的結論，認為成功是因為他們的某些特質或策略，而忽略了其他可能的因素。

為了避免倖存者偏差，研究人員應該盡可能獲取全面的數據，包括成功和失敗的案例，從而得出更客觀、全面的結論。在分析數據時，也需要謹慎思考，不僅關注成功的一面，還要考慮失敗的原因和因素，以獲得更完整的視角。

喜歡撰寫文章的你，不妨來了解一下：

Web3.0時代下為創作者、閱讀者打造的專屬共贏平台 - 為什麼要加入？

歡迎加入一起練習寫作，賺取知識！

#AI

#資料科學

阿Han的沙龍阿Han的軟體技術棧 💡AI

留言

阿Han的沙龍

153會員

328內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2025/04/23

【🤖 cursor AI】如何使用MCP Server

我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器，使用起來大幅度的提昇開發效率，但仍有些問題點需要克服，比如說： LLM壓根不知道我們的數據庫長怎樣啊？怎麼分析結構呢？假設文檔又不足的狀況下更是艱辛，如果LLM

2025/04/23

【🤖 cursor AI】如何使用MCP Server

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術，該套GPT-SoVITS也非常的出色，但效能有點不是非常理想，加上需要GPU才能達到較佳的體驗，如此一來成本就會有點高了，因此我們找了另外一套MeloTTS，這一套強調CPU推理非常的快！

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務，但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術，因此我們可能會需要將API退回舊版，在這裡我們也整理了早期版本api與api_v2的一些差異，期望幫助到正在面臨選

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14