方格精選

數據說真話?揭穿統計的幻術──辛普森悖論

更新於 發佈於 閱讀時間約 4 分鐘

我們的生活充斥著各式各樣的統計數據,選舉的得票率、肺炎的治癒率等。但你知道數據也可能會說謊嗎?本文要介紹「辛普森悖論」,帶你揭穿統計的數學陷阱。

辛普森悖論是詮釋數學統計數據時可能會發生的現象:在分組比較中表現較好的群體,在整體比較中可能表現較差。讓我們用臺北市和桃園市死亡率的例子來實際感受一下。死亡率最常使用的計算方法是「死亡人數/總人口數」。我們用內政部的資料計算出以下的結果。

raw-image

從上面的表格我們可以得到以下的結論:臺北市的死亡率比桃園市高。這有什麼特別的嗎?有的,問題就藏在細節裡。如果我們把人口以65歲為界分成兩組,會得到下面的結果。

raw-image

你發現了嗎?把人口分為兩組拆開來看,無論是年輕組或年老組,桃園市的死亡率都比臺北市更高;但把數據加總起來,臺北市的死亡率比桃園市高。這就是辛普森悖論。許多人初次聽聞這個弔詭的現象都會以為這是一個障眼法的心理測驗,懷疑作者故意用錯誤的數據誤導大家,因而自行重複驗算許多次。在此特別澄清,這是統計詮釋上確實會發生的事情。不過,到底為什麼會發生這種事?

在我們想像的數學直覺裡,要從兩個年齡組別的死亡率推知總人口的死亡率,應該把兩組的死亡率相加之後除以二,所以我們覺得總人口的死亡率會落在兩個組別的中間,而且高低排名要維持在一樣的位置。可是在這個案例裡這種感覺是錯的。

錯在哪?我們試想一下影響人類死亡最大的因子是什麼,應該是人體的健康程度。而人類的健康狀況主要又受到年齡影響。普遍來說,老年人的健康狀況比較差,死亡率也因此比較高。那麼老年人口佔總人口數的比例,就會影響到整體死亡率的差異。所以,問題就出在臺北市和桃園市的人口年齡結構不同

臺北市的老年人口佔總人口的比例為16.4%,桃園市只有10.8%,兩個縣市人口的年齡組成差距相當大。如果依照我們的數學直覺去衡量兩個縣市的死亡率(把兩組死亡率相加後除以二)等同是把兩個縣市的老年人口比例視作相同,這樣就犯了嚴重的錯誤。我們不能使用年齡組別的死亡率回推算總人口數的死亡率,必須要回到原始的死亡人數和總人口數的資料。

從以下這張圖可以清楚看到臺北市在各年齡層的死亡率幾乎全都低於桃園市(折線圖),但臺北市的老年人口比例明顯高於桃園市(區塊圖)。總而言之,儘管臺北市在各年齡層的死亡率比桃園市低,然而,老年人口的死亡率明顯高於年輕人口,而且臺北市的老年人口比例比較高,使得臺北市總死亡人數佔總人口數的比例比較多。這兩個原因導致臺北市總人口的死亡率高過於桃園市。

raw-image

從這個例子我們可以看見詮釋統計數據時確實存在陷阱。不過,問題不是出在統計數據本身,而是出在「詮釋」。當我們在閱讀統計報告時,應該進一步仔細思考,作者有沒有錯用數據進而做出錯誤結論的可能性。期望這篇文章能讓讀者繼續抱著熱情,但帶著更嚴謹與細心的態度一起探索世界。

🥇 本文獲得 2020 全國科學探究競賽 社會組 第二名

📑 參考

  • 中華民國內政部。網站提供人口統計資料。

🛒 延伸閱讀

留言
avatar-img
留言分享你的想法!
avatar-img
圖地的沙龍
61會員
93內容數
喜歡地圖?熱愛圖表嗎? 圖地,是「圖表、地圖、資訊圖像」的創作園地。 這裡會使用圖像呈現數據資料, 透過數據看見現象趨勢與議題故事。 在 Instagram 和 Facebook 會比較頻繁更新圖表。若有適合的內容會節選修改後發表於此。歡迎大家前往追蹤~
圖地的沙龍的其他內容
2025/04/07
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
2025/04/07
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
2025/04/06
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
2025/04/06
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
2025/04/05
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
2025/04/05
WeHelp是台灣的軟體工程師社群,它的網站有程式解題系統 WeHelp Coding,提供基礎的程式練習題,適合新手熟悉語法、建立寫程式的邏輯思維。網站不會保留使用者的作答結果,因此我在這裡留下自己的解答,以及參考AI後修改的解法。本文用JavaScript解題,附上題目和註解供大家參考。
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
最近聽到許多朋友的親人驟逝,也聽到許多人的健康出現了危機;當然也偶有聽聞家庭失和、與朋友分手等等惱人的問題旋踵而至。這些因素都會困擾著一個人的正常作息,當我們想要好好的思考一件事;想要靜下心來做些心裡一直想做的事情的時候,忐忑的思緒簡直讓人窒息!不知道朋友們,現在的你是否有此困擾呢?   根據國
Thumbnail
最近聽到許多朋友的親人驟逝,也聽到許多人的健康出現了危機;當然也偶有聽聞家庭失和、與朋友分手等等惱人的問題旋踵而至。這些因素都會困擾著一個人的正常作息,當我們想要好好的思考一件事;想要靜下心來做些心裡一直想做的事情的時候,忐忑的思緒簡直讓人窒息!不知道朋友們,現在的你是否有此困擾呢?   根據國
Thumbnail
65歲以上老年人口占總人口比率達到7%時稱為「高齡化社會」,達到14%是「高齡社會」,若達20%則稱為「超高齡社會」 【行政院主計處】統計65歲以上占人口比例如下 (各部門統計會有約1年的差距) 1994 年超過 7% 進入「高齡化社會」。 2017 年 2 月首度老年超過幼年人口,201
Thumbnail
65歲以上老年人口占總人口比率達到7%時稱為「高齡化社會」,達到14%是「高齡社會」,若達20%則稱為「超高齡社會」 【行政院主計處】統計65歲以上占人口比例如下 (各部門統計會有約1年的差距) 1994 年超過 7% 進入「高齡化社會」。 2017 年 2 月首度老年超過幼年人口,201
Thumbnail
台灣的國民壽命近年趨勢如何?疫情對壽命的影響是什麼?不同縣市的差異怎麼樣?結果同步發布到Tableau Public,一起來看看吧!
Thumbnail
台灣的國民壽命近年趨勢如何?疫情對壽命的影響是什麼?不同縣市的差異怎麼樣?結果同步發布到Tableau Public,一起來看看吧!
Thumbnail
生如夏花之絢爛,死如秋葉之靜美 前言 根據世界衛生組織定義,65歲以上老年人口占總人口比率達到7%時稱為「高齡化社會」,達到14%是「高齡社會」,若達20%則稱為「超高齡社會」。而依據內政部的統計,台灣在民國107年3月底,65歲以上老年人口占總人口比率即已達到14.05%,也就是說,7個台灣人中就
Thumbnail
生如夏花之絢爛,死如秋葉之靜美 前言 根據世界衛生組織定義,65歲以上老年人口占總人口比率達到7%時稱為「高齡化社會」,達到14%是「高齡社會」,若達20%則稱為「超高齡社會」。而依據內政部的統計,台灣在民國107年3月底,65歲以上老年人口占總人口比率即已達到14.05%,也就是說,7個台灣人中就
Thumbnail
新聞報導:國人平均壽命已經超過80歲,台北市為全國最高壽命的都市達84.17歲,而最低壽命的台東縣也有76.64歲。台灣已於1993年成為高齡化社會,2018年轉為高齡社會,推估將於2025年邁入超高齡社會。若與亞洲主要國家比較,我國老化的速度與世界各國比較,台灣呈現出人口加速老化驚人的現實狀況。
Thumbnail
新聞報導:國人平均壽命已經超過80歲,台北市為全國最高壽命的都市達84.17歲,而最低壽命的台東縣也有76.64歲。台灣已於1993年成為高齡化社會,2018年轉為高齡社會,推估將於2025年邁入超高齡社會。若與亞洲主要國家比較,我國老化的速度與世界各國比較,台灣呈現出人口加速老化驚人的現實狀況。
Thumbnail
跨域、圖表閱讀統整反思力也是素養考題的重要型式,今天跟大家分享二個和我們這一代和下一代都有深刻相關的數據圖表~~ 台灣即將於2025年進入超高齡社會,意思是每5個人中會有一位是65歲的長者,目前推估2050年會是老年人口比例的最高峰,到時台灣社會大概將近每2個人就會有一位是65歲的長者。
Thumbnail
跨域、圖表閱讀統整反思力也是素養考題的重要型式,今天跟大家分享二個和我們這一代和下一代都有深刻相關的數據圖表~~ 台灣即將於2025年進入超高齡社會,意思是每5個人中會有一位是65歲的長者,目前推估2050年會是老年人口比例的最高峰,到時台灣社會大概將近每2個人就會有一位是65歲的長者。
Thumbnail
我用父母心情看這個圖表,我用家有年邁父母看這個圖表,我都不覺的在上位者能輕鬆帶過,政府該做的是全盤的戰略,而不是且戰且走,這樣跟俄羅斯打烏克蘭有甚麼不一樣?還是現在流行且戰且走?
Thumbnail
我用父母心情看這個圖表,我用家有年邁父母看這個圖表,我都不覺的在上位者能輕鬆帶過,政府該做的是全盤的戰略,而不是且戰且走,這樣跟俄羅斯打烏克蘭有甚麼不一樣?還是現在流行且戰且走?
Thumbnail
答案很清楚:疫苗打愈多劑,死亡風險愈低。
Thumbnail
答案很清楚:疫苗打愈多劑,死亡風險愈低。
Thumbnail
內政部統計,去年全國總出生數為16萬5249人,今年1至11月總出生數13萬9693人,比去年同期減少8009人;死亡數方面,去年1至11月共15萬7948人死亡,今年死亡人數增加1萬45人,今年「生不如死」現象比去年嚴重。
Thumbnail
內政部統計,去年全國總出生數為16萬5249人,今年1至11月總出生數13萬9693人,比去年同期減少8009人;死亡數方面,去年1至11月共15萬7948人死亡,今年死亡人數增加1萬45人,今年「生不如死」現象比去年嚴重。
Thumbnail
這個社會上「人命有價」,但我們從不知在背後撥打算盤的是誰、又如何盤算?  哥倫比亞大學頂尖統計學家、衛生經濟學家、聯合國首席統計模型專家弗里德曼,從與我們息息相關的保費、生兒育女到法律獎懲、政策制定,甚至是恐怖攻擊的賠償金,探究人命究竟如何在這個社會被定價,並帶我們思辨──這樣的定價方式合理嗎?
Thumbnail
這個社會上「人命有價」,但我們從不知在背後撥打算盤的是誰、又如何盤算?  哥倫比亞大學頂尖統計學家、衛生經濟學家、聯合國首席統計模型專家弗里德曼,從與我們息息相關的保費、生兒育女到法律獎懲、政策制定,甚至是恐怖攻擊的賠償金,探究人命究竟如何在這個社會被定價,並帶我們思辨──這樣的定價方式合理嗎?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News