方格精選

數據說真話?揭穿統計的幻術──辛普森悖論

閱讀時間約 3 分鐘
我們的生活充斥著各式各樣的統計數據,選舉的得票率、肺炎的治癒率等。但你知道數據也可能會說謊嗎?本文要介紹「辛普森悖論」,帶你揭穿統計的數學陷阱。
辛普森悖論是詮釋數學統計數據時可能會發生的現象:在分組比較中表現較好的群體,在整體比較中可能表現較差。讓我們用臺北市和桃園市死亡率的例子來實際感受一下。死亡率最常使用的計算方法是「死亡人數/總人口數」。我們用內政部的資料計算出以下的結果。
從上面的表格我們可以得到以下的結論:臺北市的死亡率比桃園市高。這有什麼特別的嗎?有的,問題就藏在細節裡。如果我們把人口以65歲為界分成兩組,會得到下面的結果。
你發現了嗎?把人口分為兩組拆開來看,無論是年輕組或年老組,桃園市的死亡率都比臺北市更高;但把數據加總起來,臺北市的死亡率比桃園市高。這就是辛普森悖論。許多人初次聽聞這個弔詭的現象都會以為這是一個障眼法的心理測驗,懷疑作者故意用錯誤的數據誤導大家,因而自行重複驗算許多次。在此特別澄清,這是統計詮釋上確實會發生的事情。不過,到底為什麼會發生這種事?
在我們想像的數學直覺裡,要從兩個年齡組別的死亡率推知總人口的死亡率,應該把兩組的死亡率相加之後除以二,所以我們覺得總人口的死亡率會落在兩個組別的中間,而且高低排名要維持在一樣的位置。可是在這個案例裡這種感覺是錯的。
錯在哪?我們試想一下影響人類死亡最大的因子是什麼,應該是人體的健康程度。而人類的健康狀況主要又受到年齡影響。普遍來說,老年人的健康狀況比較差,死亡率也因此比較高。那麼老年人口佔總人口數的比例,就會影響到整體死亡率的差異。所以,問題就出在臺北市和桃園市的人口年齡結構不同
臺北市的老年人口佔總人口的比例為16.4%,桃園市只有10.8%,兩個縣市人口的年齡組成差距相當大。如果依照我們的數學直覺去衡量兩個縣市的死亡率(把兩組死亡率相加後除以二)等同是把兩個縣市的老年人口比例視作相同,這樣就犯了嚴重的錯誤。我們不能使用年齡組別的死亡率回推算總人口數的死亡率,必須要回到原始的死亡人數和總人口數的資料。
從以下這張圖可以清楚看到臺北市在各年齡層的死亡率幾乎全都低於桃園市(折線圖),但臺北市的老年人口比例明顯高於桃園市(區塊圖)。總而言之,儘管臺北市在各年齡層的死亡率比桃園市低,然而,老年人口的死亡率明顯高於年輕人口,而且臺北市的老年人口比例比較高,使得臺北市總死亡人數佔總人口數的比例比較多。這兩個原因導致臺北市總人口的死亡率高過於桃園市。
(圖片為作者自行繪製。ASDR指的是年齡別死亡率,也就是那個年齡層的死亡率。)
從這個例子我們可以看見詮釋統計數據時確實存在陷阱。不過,問題不是出在統計數據本身,而是出在「詮釋」。當我們在閱讀統計報告時,應該進一步仔細思考,作者有沒有錯用數據進而做出錯誤結論的可能性。期望這篇文章能讓讀者繼續抱著熱情,但帶著更嚴謹與細心的態度一起探索世界。
🥇 本文獲得 2020 全國科學探究競賽 社會組 第二名

📑 參考

  • 中華民國內政部。網站提供人口統計資料。

🛒 延伸閱讀

為什麼會看到廣告
avatar-img
59會員
88內容數
喜歡地圖?熱愛圖表嗎? 圖地,是「圖表、地圖、資訊圖像」的創作園地。 這裡會使用圖像呈現數據資料, 透過數據看見現象趨勢與議題故事。 在 Instagram 和 Facebook 會比較頻繁更新圖表。若有適合的內容會節選修改後發表於此。歡迎大家前往追蹤~
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
圖地的沙龍 的其他內容
短短兩年的時間,高雄人經歷了四次選舉:2018 年 11 月 市長選舉、2020 年 1 月 總統選舉、2020 年 6 月市長罷免、2020 年 8 月市長補選。其中三次跟韓國瑜有關,陳其邁也出場了兩次。接下來就圖表+地圖來解析選舉結果吧!
這篇文章要介紹什麼是「高塔圖」,並分析這種圖的特色。接著再用我創作的高塔圖來解析 2008~2020 年四屆立委選舉的變化。高塔圖是一種呈現選舉結果的圖表,橫軸呈現兩大陣營的得票率差距,縱軸顯示得到的票數。這樣的圖表可以凸顯「贏者全拿」的現象,也能看見各地方選舉被忽略掉的差異。
資訊設計百百種,光是「捷運各站進出量」的主題就可以列舉許多案例。PTT 的文字整理可以總覽各站的排名和數據,還能比較漲跌趨勢。泡泡地圖則能夠把數據圖形化和空間化,讓讀者更直觀理解各站之間的差異和相對位置。要設計出好看、好懂、看了會喜歡的圖表,隱含許多設計的學問,需要具被資料處理和美術設計的能力。
這篇文章要簡單介紹粗獷主義建築,還有夾雜我的觀展心得。 1950 年代,法國建築師柯比意 Le Corbusier 使用混凝土當作建築的材料,並稱之為 béton brut,或者說是「清水模」。法文詞彙 brut,有「直接、粗糙、強壯」的意思,恰好能準確的形容這種建築風格。
這篇文章要談談布列松攝影作品的價值,並分享我看這些作品的觀點。 布列松 Henri Cartier-Bresson(1908-2004)是一名法國的攝影師,此次展覽的作品主要拍攝於 1948-1949 年的中國,地點包含北京、上海、杭州、南京、香港。這是兩岸政治與歷史的關鍵年代,我們對這段歷史或多或
讓我們回到 500 年前,16 世紀歐洲文藝復興的時代。當時有許多希臘羅馬時期的古典文獻被人們翻出來,重新受到歐洲知識份子的重視,並進行更深入的研究。解剖學是其中一個領域,有越來越多學者投入解剖學的研究,試圖驗證或修正古典時期的發現。 Andreas Vesalius (1514-1614)是當時最
短短兩年的時間,高雄人經歷了四次選舉:2018 年 11 月 市長選舉、2020 年 1 月 總統選舉、2020 年 6 月市長罷免、2020 年 8 月市長補選。其中三次跟韓國瑜有關,陳其邁也出場了兩次。接下來就圖表+地圖來解析選舉結果吧!
這篇文章要介紹什麼是「高塔圖」,並分析這種圖的特色。接著再用我創作的高塔圖來解析 2008~2020 年四屆立委選舉的變化。高塔圖是一種呈現選舉結果的圖表,橫軸呈現兩大陣營的得票率差距,縱軸顯示得到的票數。這樣的圖表可以凸顯「贏者全拿」的現象,也能看見各地方選舉被忽略掉的差異。
資訊設計百百種,光是「捷運各站進出量」的主題就可以列舉許多案例。PTT 的文字整理可以總覽各站的排名和數據,還能比較漲跌趨勢。泡泡地圖則能夠把數據圖形化和空間化,讓讀者更直觀理解各站之間的差異和相對位置。要設計出好看、好懂、看了會喜歡的圖表,隱含許多設計的學問,需要具被資料處理和美術設計的能力。
這篇文章要簡單介紹粗獷主義建築,還有夾雜我的觀展心得。 1950 年代,法國建築師柯比意 Le Corbusier 使用混凝土當作建築的材料,並稱之為 béton brut,或者說是「清水模」。法文詞彙 brut,有「直接、粗糙、強壯」的意思,恰好能準確的形容這種建築風格。
這篇文章要談談布列松攝影作品的價值,並分享我看這些作品的觀點。 布列松 Henri Cartier-Bresson(1908-2004)是一名法國的攝影師,此次展覽的作品主要拍攝於 1948-1949 年的中國,地點包含北京、上海、杭州、南京、香港。這是兩岸政治與歷史的關鍵年代,我們對這段歷史或多或
讓我們回到 500 年前,16 世紀歐洲文藝復興的時代。當時有許多希臘羅馬時期的古典文獻被人們翻出來,重新受到歐洲知識份子的重視,並進行更深入的研究。解剖學是其中一個領域,有越來越多學者投入解剖學的研究,試圖驗證或修正古典時期的發現。 Andreas Vesalius (1514-1614)是當時最
你可能也想看
Google News 追蹤
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
隨因為推論統計邏輯明顯有問題 心理學實驗看到的 p value是 P(Data| Hyptohesis), 也就是假設成立的情況下拿到這樣的資料的機率 以下是大家常見的推論步驟: 先設一個虛無假設 (H0) 拿資料, 算 p value ( = P(Data | Hypothesis)
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
「超高齡社會」一般指65歲以上人口比例超過20%的社會。此一術語通常用以描述一個國家或地區其老年人口比例快速增加,並且已達相對較高水平。「超高齡社會」的特點是老年人口的占比飆高,並且經常伴隨社經和醫療挑戰。亟需政府和社會各界預為籌繆,以應對激增的需求和社會劇烈的變化。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
根據以內政部人口統計資料,民國110年12月底的數據,推估民國110年12月底台灣失智人口共312,166人,佔全國總人口1.34 %,亦即在台灣約每74人中即有1人是失智者。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
隨因為推論統計邏輯明顯有問題 心理學實驗看到的 p value是 P(Data| Hyptohesis), 也就是假設成立的情況下拿到這樣的資料的機率 以下是大家常見的推論步驟: 先設一個虛無假設 (H0) 拿資料, 算 p value ( = P(Data | Hypothesis)
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
「超高齡社會」一般指65歲以上人口比例超過20%的社會。此一術語通常用以描述一個國家或地區其老年人口比例快速增加,並且已達相對較高水平。「超高齡社會」的特點是老年人口的占比飆高,並且經常伴隨社經和醫療挑戰。亟需政府和社會各界預為籌繆,以應對激增的需求和社會劇烈的變化。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
根據以內政部人口統計資料,民國110年12月底的數據,推估民國110年12月底台灣失智人口共312,166人,佔全國總人口1.34 %,亦即在台灣約每74人中即有1人是失智者。