「你覺得所得分配,是越來越平均,還是越來越不平均?」
我們都聽過一句話,「統計數據會說謊」;也聽過另一句話,「數據不會說謊」。(有趣的是,這兩句話,剛好分別是兩本書的書名。)
所以,數據到底會不會說謊呢?
嗯,這個問題的答案取決於「你對統計的認識程度」。
如果不懂統計,你就很容易被無良政客、不肖商人用統計數字欺騙;如果學過點「統計防身術」,你就能看出數字背後所藏匿的訊息,所有的數據詐術在你面前,皆一覽無遺。
想學點「統計防身術」嗎?來本《臥底經濟學家的10堂數據偵探課》吧!
來源:https://www.kobo.com/tw/zh/ebook/4w8jG-ImKzyI68AYOMknZA
這本書是2022年,第一本我給「五顆星」的經典好書。
作者提姆.哈福特(Tim Harford),有本著名的暢銷書叫做《親愛的臥底經濟學家》,所以,他在江湖上有個稱號,就叫做「臥底經濟學家」。
哈福特是我非常喜歡的經濟學普及作家,他擅長用故事、生活案例解說經濟學原理,且過程完全不涉及任何數學公式。他的書文筆流暢,淺顯易懂,讓人讀來趣味盎然。
人稱「臥底經濟學家」的提姆.哈福特(Tim Harford)
來源:https://commons.wikimedia.org/wiki/File:Tim_Harford_in_2012.jpg
這本《臥底經濟學家的10堂數據偵探課》,主要在談「如何正確的理解、使用統計數據」,才不會讓你鬧笑話、被人騙。
身為經濟學家的哈福特,成天與數據為伍,他從自身實務經驗,總結歸納了看待統計數據的「十條準則」。
我從中挑選了兩個,印象較深刻的概念與你分享:
1. 蟲的視角VS鳥的視角
2. 統計,很多時候是語言學的問題
蟲的視角VS鳥的視角
讓我們回到文章開頭的那個問題:
「你覺得所得分配,是越來越平均,還是越來越不平均?」
來源:https://stringfixer.com/tags/prot%C3%A1goras
我猜,沒意外的話,你的答案應該和我相同,都認為是「越來越『不』平均了」。
為什麼?
看看20年前的薪水,再看看現在的薪水;看看20年前的房價,再看看現在的房價。這是實打實的「生活」告訴我們的。
但作者在書中卻告訴我們,從統計數據──吉尼係數──來看,全球的所得分配,其實是越來越平均的。因為大量原本非常貧困的人(許多分布在中國和印度),生活水準和過去相比,獲得了大幅提升。
這就引出一個問題:到底是我們的「個人經驗」錯了,還是「統計數據」錯了
其實,兩者都是對的。
作者稱這種,「個人經驗」的判斷為「蟲的視角」,「統計數據」的判斷為「鳥的視角」。
蟲在地上爬,只能看見狹小的範圍,在時間和空間上,受到嚴重的侷限;鳥在天上飛,擁有遼闊的視野,能突破時間和空間的限制。
也許有人會說:「這種鳥的視角對我有什麼幫助呢?身為蟲子,我能感受到的、我在乎的,就是我四周的生活環境。『全球』貧富差距大不大,與我何干?我只在意,此時、此地、此刻──台灣,貧富差距有多大,我買不買的起房。」
對夏蟲來說,不可語冰又如何?夏蟲的生活,本來就不會、也可能永遠不會有冰!
這種想法沒有錯,但有些事情,只靠蟲的視角是無法回答的,你必須飛起來,用鳥的視角來看。
比如說,「抽菸會不會導致肺癌?」
你看了自己的爺爺,50年的老菸槍,80幾歲了還是生龍活虎的,罵起人來中氣十足;你考察了身邊有抽菸的人,發現他們也沒幾個得到肺癌。反倒是沒抽菸的,倒是有人得了肺癌。因此,你下了一個判斷:「得不得肺癌,和抽菸無關!」
不用學過統計、科學,有點常識都知道,這個判斷是有問題的──因為,你不能只考察身邊的人,你要考察全世界的人;你不能只看最近這幾年,你要看過去50年,甚至是100年。唯有這樣的觀察所得到的結論,才夠強硬,才對我們的生活有指導意義。
有些東西,蟲看不見,唯有鳥才看的見。
口罩對新冠肺炎的防護力有多高?疫苗到底有沒有效?打疫苗的死亡風險有多高?
這些問題,個人經驗都是單獨的「點」,參考價值極有限,你必須靠統計這枝畫筆,將點連成線,將線延展成面,才能獲得有意義的資訊。
這就是為什麼,光有蟲的視角還不夠,我們還需要──鳥的視角。
統計,很多時候是語言學的問題
來看一個真實的統計數據:
「在芬蘭,嬰兒死亡率為0.23%,相當於每一千名嬰兒中,有2.3人死亡;而在美國,這個數字是0.61%,也就是每一千名嬰兒中,有6.1人死亡。」
美國的嬰兒死亡率,竟然是芬蘭的2.7倍!
為什麼會這樣?
難道是因為,自詡為全世界最強大的國家,美國,醫療水平遠不如北歐的一個小國芬蘭嗎?
當然不是。背後的原因,可能會讓你乎意料。真正的原因,是因為……「兩個國家對『嬰兒』的定義不同!」
「對嬰兒的定義不同?這是什麼意思呢?」
在美國,超過22周終止懷孕的狀況,稱為「嬰兒死亡」;不到22周終止懷孕的,則稱為「流產」。在芬蘭,嬰兒死亡的基準線,則是劃在24周。
就是因為兩個國家,在對「什麼是嬰兒」的定義上不同,才會導致嬰兒死亡率有如此大的落差。所以這個現象,完全不是醫療問題、不是數學問題,純粹就是個語文問題──「你如何『定義』一個概念或名詞。」
在心理學、社會科學實驗中,也有不少類似的例子。這些研究,有一個小小麻煩點,就是用詞平易近人、結論淺顯易懂,以至於許多人以為「自己看懂了」,就以它為證據、武器,去攻擊和自己立場相左的人──不少政治人物都是這樣幹的。
比如說下面的例子:「一項最新研究顯示,玩暴力電玩的孩子,比較可能在現實生活中展現暴力行為。」
這個研究結果夠白話、夠簡單了吧!每個字我們都看懂了。但,你確定,你真的了解這段描述中,每個語詞的定義嗎?
比如說,「暴力電玩」的定義是什麼?「格鬥天王」算不算暴力遊戲?
你說:「算!因為他有暴力的元素──打鬥。」
那踩香菇的「超級瑪利歐」算不算?把動物裝在一個手掌大的球裡,還讓他們互相殘殺的「神奇寶貝」算不算?
再比如,「玩」的定義是什麼?每天接觸10分鐘算不算玩?還是要超過一定的時間才算玩?玩的「量」,要看頻率還是總時數?玩的「地點」,是在自己家裡玩,還是被研究人員找到大學實驗室裡玩?也就是結論是「統計」來的,還是「實驗」來的?
「暴力行為」的定義又是什麼?怎麼量化「變得更暴力」這件事?
如果以上問題你都沒想過,這些概念都沒有弄清楚,就急著下結論,以此為所謂的「科學證據」,攻擊和自己價值觀、立場相反的人,不覺得太草率了嗎?這種行為和某些政客,有什麼區別呢?
所以,當看到統計數據、研究結果時,別急著下判斷,先確認自己,「弄清楚所有語詞的定義、指涉的對象」──哪怕這個語詞在表面上看起來有多麼「白話」。
最後,來一道和台灣有關的練習題:「死亡率達4.81%!台灣新冠肺炎致死率高於全球平均!」
在下判斷、使用這個研究結果之前,你弄清楚「死亡率」的定義了嗎?你知道死亡率分成兩種,一種叫「致死率」,一種叫「感染死亡率」。這則新聞標題中說的死亡率,是哪一種呢?
在個人有限的生命經驗裡,我們都是蟲子,需要統計這雙翅膀,讓我們騰空而起,以鳥的視角,俯瞰大地。