數與人系列:常態的迷思

更新於 發佈於 閱讀時間約 5 分鐘

常態分布(又稱高斯分布)可說是大多統計人最熟悉的統計分布,但正如人們往往會在自認為最熟悉的領域犯錯而不自覺,這個統計人最倚賴的分布其實也是最容易造成誤解的統計概念之一。

不過,要打破常態分布所帶來的迷思,還是得像畢卡索所建議的,先像一個專家學習專業知識,再像一個藝術家想辦法破解之。

常態分配在現代統計學中為什麼重要?

這牽涉到統計人對「平均數」(mean)的興趣。

至於為什麼要計算平均數呢?

這牽涉到統計人想了解的「一般人」。也就是說,當統計人想知道在一個社會中一般人過得如何就會去計算相關的平均統計量(每人每月平均蘋果消耗量、每月平均安眠藥消耗量,每年平均收入),以了解他們的生活狀況。(相關文章:平均的落點。)

當然,囿於許多現實上的限制,研究者可能沒法進行真正的普查,所以只能用樣本平均數來推論母群平均數,這時候,就要借助樣本平均數的機率分配來幫助估算誤差。而這所謂平均數的機率分配剛好就是所謂的常態分配。

下面這張圖說明用來計算平均數誤差的中央極限定理的推導。 不論原來母群的分配型態是什麼,都可以算出一個平均數。如果樣本數是5(如果一次從母群得到5個觀察值,再求樣本平均值 ),那麼多抽幾次以後,就會得到一個樣本數為5 的樣本平均數的抽樣分配。同理,我們也可以一次從母群抽得 30 個觀察值,再求這些觀察值的平均數,然後求這些樣本平均數的觀察值,就可以得到一個樣本數為 30 的樣本平均數的抽樣分配。


raw-image

所謂的中央極限定理和大數法則就是說,如果樣本數越大,得到的抽樣分配就會越趨近常態分配。(相關文章:和常態分布有關的統計心法

這讓許多統計人在利用「樣本平均數」做 「母群平均數」的推估時,常常忘了,縱使他們可以利用中央極限定理預測出一個「母群的平均數」也不代表「原本觀察值的母群」會是一個「常態分配」。

比如說,我們想用抽樣調查的方式去評估如今台灣每年家戶收入的平均收入。但若是只算出一個家戶平均收入而沒有留意抽樣的分配特性,就可能會讓我們錯估台灣目前的經濟狀態。

因為,各種不同的收入型態分布都可以計算出平均值。貧富差距很大的社會也可以算出一個平均值,收入震盪起伏很大的行業也可以算出一個平均值。因此,若是只根據一個估算的平均值來判斷社會經濟運作的良好與否,不但沒有幫助解決社會經濟問題,甚至可能有誤導作用。

例如,我們可以在新冠疫情期間,藉由網路調查這段時間的家戶收入,而且剛好抽到很多因為疫情所以在家工作的樣本,由於這些樣本的工作及收入並未受到封城的影響,那麼就可能有人會利用這些樣本的資料,宣稱台灣的家戶生活並未因封城而有太大影響。

同理,我們如果過度執著去計算一個社會中,到底有多少人打了疫苗,或者打了幾劑,有時也可能沒有多大意義。因為,我們的疫苗分配並不是從全體國民中隨機抽樣施打的,而是讓有些族群優先施打的。因此,我們可以預測這些相關疫苗施打模式會呈現出一些特定的模式。以目前傳出的「特權疫苗」新聞來說,我們就可以猜測: 在台灣,「疫苗」已經成為大多數人的「安全感」來源了,那麼,我們也可以大膽預估,有一定比例打不到疫苗(或覺得自己接種的疫苗保護力不足)的人即使解封,應該也不敢群聚活動,自然就不會對權力者造成威脅了。

當然,用這種方式來「自然」「減少」某些地區的人民活動,是不是符合社會正義,那就要看權力者「自圓其說」的能力了。(下圖圖片來自風傳媒 2018年文章:蔡英文駁「拒馬總統。)


raw-image

再回到「常態分布」。

所謂的「常態分布」有好幾個特色,是很值得注意的:第一,數值以平均數為中線,構成左右對稱之單峰、鐘型曲線分布。第二,數值之平均數、中位數和眾數為同一數值。


raw-image


這意味著,在一個常態分布中,平均數是一個很有代表性的數值。如果一個社會的家戶平均收入真是呈穩定的常態分布,那麼我們的確可以用「平均數」來描繪這個社會中的「一般人」的生活樣貌。

但,如果這個社會的家戶收入是有好幾個頂峰的,或是偏斜的 ⋯⋯那麼,「平均數」所呈現的,真的有助於了解社會上「一般人」的生活嗎?


raw-image

這個問題值得想從「數字」了解問題,而不是掩蓋問題的「數字人」們好好想想。











留言
avatar-img
留言分享你的想法!
avatar-img
蓮子水共同體的沙龍
55會員
425內容數
曬書天,好奇地。 文圖連播,播出新識界。 紅柿子在這方小天地不只曬書,也曬心得。
2021/10/29
地圖是人類探索空間的利器,在歷史上,地圖除了幫助人們探索新空間,還如何幫助人們解決城市中的傳染病問題呢? 在數位化的浪潮中,繪製資訊地圖越來越容易,我們又可以如何運用投票結果來讓「代議民主」運作得更順暢呢?
Thumbnail
2021/10/29
地圖是人類探索空間的利器,在歷史上,地圖除了幫助人們探索新空間,還如何幫助人們解決城市中的傳染病問題呢? 在數位化的浪潮中,繪製資訊地圖越來越容易,我們又可以如何運用投票結果來讓「代議民主」運作得更順暢呢?
Thumbnail
2021/08/17
一個國家印的鈔票如果太多,超過流通中實際上所需要的貨幣量,就很有可能造池通貨膨漲現象。如果大家都把五倍券往大賣場送,會不會形成「通貨膨脹」或「馬太效應」的現象呢?
Thumbnail
2021/08/17
一個國家印的鈔票如果太多,超過流通中實際上所需要的貨幣量,就很有可能造池通貨膨漲現象。如果大家都把五倍券往大賣場送,會不會形成「通貨膨脹」或「馬太效應」的現象呢?
Thumbnail
2021/08/12
在西方,有越來越多思想家開始思辨資本與金錢(或貨幣)的關係。貨幣很早就出現,但卻沒有發展成「提高生產力」的觀念,而這才應該是「資本」能提高「財富」的關鍵。 既然中國共產黨主政下的「國家資本主義」發展如此受世人矚目,我們不妨採用這個「提高生產力」的觀念來看近來在台灣「現金」與 「五倍券」的爭議。
Thumbnail
2021/08/12
在西方,有越來越多思想家開始思辨資本與金錢(或貨幣)的關係。貨幣很早就出現,但卻沒有發展成「提高生產力」的觀念,而這才應該是「資本」能提高「財富」的關鍵。 既然中國共產黨主政下的「國家資本主義」發展如此受世人矚目,我們不妨採用這個「提高生產力」的觀念來看近來在台灣「現金」與 「五倍券」的爭議。
Thumbnail
看更多
你可能也想看
Thumbnail
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
Thumbnail
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
Thumbnail
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
Thumbnail
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
Thumbnail
眾所周知,標準差是離均差的方均根,取平均時的分母自然是數據的數量 n,但這個標準差只限於用在計算母體,抽樣後計算樣本標準差時卻要改成除以 n-1,這是為什麼呢? 本文將以兩種方式來說明,第一種方法比較容易理解但也較不嚴謹,第二種則涉及較多數學運算,但可以彌補第一種的缺失,提供更明確的佐證。
Thumbnail
眾所周知,標準差是離均差的方均根,取平均時的分母自然是數據的數量 n,但這個標準差只限於用在計算母體,抽樣後計算樣本標準差時卻要改成除以 n-1,這是為什麼呢? 本文將以兩種方式來說明,第一種方法比較容易理解但也較不嚴謹,第二種則涉及較多數學運算,但可以彌補第一種的缺失,提供更明確的佐證。
Thumbnail
你可以不懂統計,但不能不知道統計思維,尤其在這個大數據時代。​這能讓你更好地解讀身邊的資訊,運用這些資訊來做出更好的決定與判斷。
Thumbnail
你可以不懂統計,但不能不知道統計思維,尤其在這個大數據時代。​這能讓你更好地解讀身邊的資訊,運用這些資訊來做出更好的決定與判斷。
Thumbnail
我們每天都會接觸到龐大的數據量,但多數人未必知道如何正確地解讀。在這本《一次看懂小數據》中講述了我們該如何解讀每天接觸到的資料,將複雜的問題變得更簡單和直觀?如何避免陷入面對數據常犯的錯誤與盲點?在這篇文章中,我歸納整理的三個重點。
Thumbnail
我們每天都會接觸到龐大的數據量,但多數人未必知道如何正確地解讀。在這本《一次看懂小數據》中講述了我們該如何解讀每天接觸到的資料,將複雜的問題變得更簡單和直觀?如何避免陷入面對數據常犯的錯誤與盲點?在這篇文章中,我歸納整理的三個重點。
Thumbnail
常態分布(又稱高斯分布)可說是大多統計人最熟悉的統計分布,但正如人們往往會在自認為最熟悉的領域犯錯而不自覺,這個統計人最倚賴的常態分布其實也是最容易造成誤解的統計概念之一。不過,要打破常態分布所帶來的迷思,還是得像畢卡索所建議的,先像一個專家學習專業知識,再像一個藝術家想辦法破解之。
Thumbnail
常態分布(又稱高斯分布)可說是大多統計人最熟悉的統計分布,但正如人們往往會在自認為最熟悉的領域犯錯而不自覺,這個統計人最倚賴的常態分布其實也是最容易造成誤解的統計概念之一。不過,要打破常態分布所帶來的迷思,還是得像畢卡索所建議的,先像一個專家學習專業知識,再像一個藝術家想辦法破解之。
Thumbnail
出身比利時的凱特爾(Quetelet,1796 -- 1874) 就致力於以計量方式描述「平均人」(average man )的觀念。他表示「一個時代的偉大、善或美都體現在一個具有各種社會平均特徵的人身上」但「平均」不就是「平凡」嗎?光是預測平凡又有什麼意義?
Thumbnail
出身比利時的凱特爾(Quetelet,1796 -- 1874) 就致力於以計量方式描述「平均人」(average man )的觀念。他表示「一個時代的偉大、善或美都體現在一個具有各種社會平均特徵的人身上」但「平均」不就是「平凡」嗎?光是預測平凡又有什麼意義?
Thumbnail
觀看主流風格以外的電影,有可能是一種「嘗鮮」。漫威宇宙的電影看多了必然會有些「審美疲勞」。每天吃龍蝦鮑魚佛跳牆,偶而多吃點清燉蘿蔔湯,不表示會就此改口換味。當滿街都是珍珠奶茶手搖飲料店,突然出現一家英式玫瑰茶品味館也可能會特具吸引力。卻不能直接推論:去英式玫瑰茶品味館的一定是喜歡莎士比亞的藝文人士。
Thumbnail
觀看主流風格以外的電影,有可能是一種「嘗鮮」。漫威宇宙的電影看多了必然會有些「審美疲勞」。每天吃龍蝦鮑魚佛跳牆,偶而多吃點清燉蘿蔔湯,不表示會就此改口換味。當滿街都是珍珠奶茶手搖飲料店,突然出現一家英式玫瑰茶品味館也可能會特具吸引力。卻不能直接推論:去英式玫瑰茶品味館的一定是喜歡莎士比亞的藝文人士。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News