如何訓練自己沒這麼容易上當?
這是我在圖書館會拿起這本書的原因,畢竟現在好多東西都是拼湊來的,更在上次與AI工程師聊過天之後,他就對我說:
AI最會的就是正經八百的胡說八道唷!
忽然醍醐灌頂,對耶!認真一看Chatgpt都是不斷順著我的話和期待在聊,更有感是在做市場研究報告時,每當我正在讚嘆AI實在是太好用了,卻按照相關連結和關鍵字去驗證資料,才發現資料失效或查無關聯。這些判斷都在字裡行間,被以訛傳訛的速度越來越快。所以與其變成知識王,倒不如就是平常要訓練好判讀資料真偽的技能。
我也期待以後可以這樣教自己的女兒。(她的世代或許會幾乎由虛擬構成)
作者小林直樹是《Nikkei Digital Marketing》旗下的記者,也就是日本指標性媒體-《日本経済新聞》,畢業於早稻田大學政治經濟學院。讀過他的背景大概就是個數位媒體人,對資料真實性有強烈的堅持,故寫了這本《小數據騙局》。
數字往往只是被挑選、被加工,而不是純粹的真相。
小林直樹在《小數據騙局》中提出八個角度,提醒我們警覺數字陷阱。以下幾個是我最有感的:
百分比陷阱 (Percentage Trap)
「200% growth」看似驚人,但若基數只有 1,實際上只是從 1 變成 3。
→ 應用:看到百分比,先問基數。
圖表操弄 (Graphical Misrepresentation)
Y 軸不從 0 開始,讓差異看起來巨大。
→ 應用:先看刻度,避免被「誇張的線條」帶偏。
平均數誤導 (Mean vs. Median)
「Average income of $70,000」可能被少數高收入者拉高,而大多數人並未分享到。
→ 應用:薪資或年終討論時,應看 Median (中位數) 才能反映真實分布。
相關 ≠ 因果 (Correlation ≠ Causation)
「Coffee drinkers live longer」只是相關,背後可能有第三因素。
→ 應用:看到因果結論,先懷疑。
數據工作者更需要對資料敏銳!
全球新聞媒體最常見的操作,就是利用資料騙局來增加流量。也不能全怪媒體,因為讀者最容易被「大幅度的成長或下滑」吸引。
台灣最具代表性的例子,就是「平均月薪」與「平均年終」。當新聞標題寫著「台北市平均年收入破兩百萬」,我們常忍不住問:是跟郭台銘一起平均的嗎?這樣的數據若改用「Median(中位數)」來表達,或許會更貼近真實。
但這樣的討論本身,也展現了國民教育的價值。因為當人們直覺覺得「數字有問題」,就會開始重新推算、檢查、反駁記者。某種程度上,這是全民數感的一次「即席演練」。
在資訊爆炸的世代,對數據保持懷疑,已經成了一種國民運動。太多假數據橫飛,對正在成長的孩子更是挑戰。他們需要面對與分辨資訊的能力,遠比我們Y世代時代艱難。也因此,父母與教育者更應該以身作則,培養孩子「問數字問題」的習慣。
露露愛看書|推薦
- 中文書名:《小數據騙局 : 不再被數字玩弄, 八個觀點教你戳破媒體的圖表謊言》
- 日文原書名:《だから数字にダマされる》
- 作者: 小林直樹 (Naoki Kobayashi)
- 出版社: 究竟出版社