每周一篇文章的讀書會心得報告摘要與筆記,主要段落分成:
1. 為什麼選這篇文章分享?
2. 作者為什麼要寫這篇文章?
3. 內容重點
4. 心得
原文網址(這次共有兩篇文章):
- 第 208 話:「頭文字一」的秘密—班佛定律
- 第 209 話:99乘法表裡的秘密—班佛定律續篇
為什麼分享這篇文章?
- 2020年的美國大選,有學者跳出來證明選票可能有舞弊行為—違反班佛定律
- 好奇班佛定律背後代表的意義
- 瞭解班佛定律,為什麼能查出是否有數據造假
作者想表達甚麼?
- 介紹班佛定律的前生今世
- 不論是自然界或人類世界,班佛定律可應用的領域甚廣
重點內容
班佛定律的前生今世
- 沒有電子計算機的時候,要算對數都要去查一本厚厚的「對數表」
- 1881年時,天文學家Simon Newcomb
- 圖書館查對數表時,發現從書的側面看過去,有一些頁面特別黑,表示那幾頁經常被翻查,所以弄得比較髒,有些頁面就比較乾淨。
- 照直覺來想,各個領域的人查數字,應該沒有特別的偏好,會滿平均的分佈才對,為什麼第一位數越小的頁面,被翻查的次數就越多呢?
- 對這個問題作了一些研究,也發表了一篇論文,提出「第一位數字」的分布公式
- 驗證了更多的數據
- 城鎮人口、河流灌溉的流域、物質的比熱、報紙頭版上出現的第一個數字(日期除外)、物理常數…等等,發現都符合這個分布
班佛定律的應用與限制
- 可以用在來自不同領域,各式各樣的數字上
- 有一些數字是不適用的,比如說數字是作為「代碼」而不是「計數」之用
身分證、2進位等...。
抓逃稅、作假帳的案例。
有一些會計軟體已經內建Benford’s law的檢測。
- 竄改數據時,首位數用了太多的4, 5, 6等中間數,違反了「頭文字1」的法則
班佛定律 Benfords law
班佛定律的樣本研究
班佛定律與乘法表
個人心得
- 最初為天文學家發現,而非數學家
- 科技跨界到其他產業,推動產業變化
- 當知道定律的人越多,有心人士偽造數字的技術是否會更高超?
- 關於班佛定律的臨界點?廣度、深度或複雜度