解開把「高度相關」誤認成「因果關係」的迷思:《真確》、《大數據的傲慢與偏見》、《異常的正常家庭》

2022/01/19閱讀時間約 4 分鐘
  Fiction 的讀者,都想看看某一個世界;non-fiction 的讀者,都想看清這一個世界。Non-fiction 的極致,大概就是讓讀者盡量看清這個世界的某個面貌吧。這裡推薦的三本書,都使用精準的方法和充足的數據,用事實換迷思。
  太多因果關係純屬一廂情願。例如玩暴力電玩的人一定比較容易出現暴力行為、例如強暴都是去危險的地方遇到壞人、例如努力就能成功。只要這些隨便建立的因果關係符合直覺或符合我們對世界的期待,我們就不管真不真確,直接信了。
  2018 比爾蓋茲推薦書籍。推薦者不只懂賺錢,也非常懂選書。可能是近五年來最佳科普書籍,而且是社會科學。這是本直指人心裡偏誤的傑作,不只是佳作。從刻板印象開始,挑戰你對這個世界的真實知識,例如:全世界有多少人有電可以用?20%?50%?80%?你的直覺答案可能和許多專家學者一樣,都偏離事實,很遠。重點在,為什麼我們往往都離事實這麼遠?其中一個關鍵因素是:我們太想要「知道」了。知道,而且能由此來做點什麼,以消除自己的無力感和焦慮。我們就是想「知道該怎麼辦」。
  那麼,教育程度高就能導致收入高嗎?這是三本題材毫不相同的書,共同提及的問題。答案是,也不是。就像世界上所有我們超想知道答案,所以期待答案要超容易理解,而且馬上可以找出一個因果關係來達成種瓜得瓜的美好願景。
  首先,教育程度高的確跟收入高在統計上有非常明顯的高度正相關,「教育程度高」幾乎可以說是「收入高」這個條件下,相關性最高的一項條件;反之亦然。看起來很明顯對吧?
  《大數據的傲慢與偏見》這本書找出利用這項迷思造成的大量劣跡:純為提升學歷而存在的學店,針對特別需要脫貧的劣勢處境青壯人口打廣告,造成學歷提升的同時債務也提升,而且這份學歷對脫貧毫無用處。
  仰賴直覺判斷,從錯誤的直覺發展出來的系統,就是這麼可怕。這本書的原名叫做 Weapons of Math Destruction(數學性毀滅武器),惡搞了大規模毀滅性武器(weapons of mass destruction)這個常用詞。 就因為全書的主旨在挑出系統性濫用或誤用資料,就會放大,而且是等比級數地放大災難後果。
  教育之所以是資料科學濫用、誤用的重災區,是因為教育的成果和成因非常難以衡量。有了教育程度和收入之間的關係來當人心裡的希望、來當政策的考量,都讓我們覺得我們在做點「什麼」。好消息是,好的教育內容和教育環境,的確對一個人的經濟處境有幫助。壞消息是,教育程度和收入高低之間的關係,可能不是強烈的因果,而是兩項都是另一個條件的主要後果:原生家庭環境。
  除了原生家庭內部,原生家庭所處的社區,更可能是犯罪率、教育程度、收入水平的影響因素。
  《真確》完全以全球數據為研究對象;《大數據的傲慢與偏見》多數的社會數據來自美國;《異常的正常家庭》則是以韓國社會為主要研究對象。這三本書的共同特徵在:以合理的取樣範圍,從真實數據剝出結論。任何從既有立場裡刮取數據對自己有利的面向,對科學而言都太卑鄙。
  《異常的正常家庭》作者有明確左派傾向,認為系統性的現況需由國家和政府採取行動。但好處是,這只影響作者在得出觀察結論後,給予社會、政治、立法批評和建議的段落。作者的結論還是來自資料,而且方法論精潔,過程值得信任。
  其中一個由數據導出的結論令人動容:「英國 1980-2012 發生的父母殺死全家後自殺的案例,加害者大多為對家庭角色有刻板印象的男性。該類型男性遇上家庭解體或破產、妻兒無法遵守自己的宗教或文化習慣,或產生過度妄想,認為自己需保護家人免於受到外部威脅時,會對家人趕盡殺絕。」與此同時,韓國殺子自殺的加害者清一色為母親。從遺言裡分析心理,才會發現韓國社會殺子自殺的理由幾乎清一色是:自己死了,社會上無人能照顧孩子,只好帶走他們。從這裡回推韓國家庭承擔的育兒功能遠大於其他社會,雖然悲哀,但比較正確。
  從實際數據的差異探究社會現象,而不是從社會現象回頭找出可能成因,比較不容易犯下方法論錯誤。然而這麼認真乾淨的書有限,看到好的就推薦一下。
  閱讀愉快。
為什麼會看到廣告
246會員
212內容數
麟左馬,旅美台灣小說家,主要寫科幻跟推理。 通常以探戈DJ和製鞋業者的身份出現,身兼舞棍。
留言0
查看全部
發表第一個留言支持創作者!