第 208 話:「頭文字一」的秘密—班佛定律(Podcast 已上線)

閱讀時間約 5 分鐘
今天來談一下「頭文字一」,不是那個「秋名山最速傳說」,會用「水溝蓋過彎」的「頭文字D」,別搞錯了喔!
請各位讀者數數你口袋裡的錢,這個數字的第一位數是多少呢?比如說你身上有一萬多、一千多、十塊錢、一塊錢,這個「第一位數」都是「1」,依此類推。如果對我們板上的讀友們做個調查,各位覺得這個數字的「頭文字」分別是1、2、3…一直到 9 的出現機率應該是多少呢?答案後面再說,先來看一下歷史。
科學與工程中經常需要做「對數」的計算,在一百多年前還沒有電子計算機的時候,大家要算對數都要去查一本厚厚的「對數表」。對數表有點類似英文字典按字母順序,是按照數字順序編排的,例如不管是要查 12345 或是 0.012345,就是掀翻到「1」的部分(會在對數表的最前面),然後在「1」這一部底下又分為「11」、「12」、「13」…「19」這九個部分,找到「12」那部分後,裡面會再分為「121」、「122」、「123」…「129」,依此類推,跟查字典一樣,要找「the」的話,先翻到「t」開頭,然後在「t」的部分找到「th」,再找「the」。
1881年時,有一位天文學家Simon Newcomb(附帶一提,他也是個科幻小說家)在圖書館查對數表時,發現從書的側面看過去,有一些頁面特別黑,表示那幾頁經常被翻查,所以弄得比較髒,有些頁面就比較乾淨。事實上,「1」的頁面最髒,「2」次之,越大的數字越乾淨。Newcomb覺得有點意外,照直覺來想,來自各個領域的人所查的五花八門的數字,應該沒有特別的偏好,會滿平均的分佈才對,為什麼第一位數越小的頁面,被翻查的次數就越多呢?
從書頁側面變髒的程度就可以知道哪些部分念得比較認真(來源:我的ARFKEN物理數學神書)
Newcomb對這個問題作了一些研究,也發表了一篇論文,提出「第一位數字」的分布公式:P(d) = log(1+1/d),這裡的 P(d) 是從 1 到 9 的數字 d 出現在第一位數的機率 log 是「以 10 為底的對數」,不過並沒有引起太大的注意。
Benford’s law,第一位數字從一到九的機率分布,數字越大出現的機率越小。
這個公式就這樣沈睡了大約50年,到了1938年,另外一位天文學家Frank Benford因為一模一樣的原因再度發現了這個定律,並且驗證了更多的數據,比如說城鎮人口、河流灌溉的流域、物質的比熱、報紙頭版上出現的第一個數字(日期除外)、物理常數…等等,發現都符合這個分布。這次 Benford 發表的論文,獲得科學界比較大的關注,這個「第一位數字定律」,也因此被命名為 Benford’s law,其實說起來,應該要叫做 Newcomb’s law 比較合理。
這個定律非常神秘,因為它幾乎可以用在來自不同領域,各式各樣的數字上。當然有一些數字是不適用的,比如說數字是作為「代碼」而不是「計數」之用,例如身份證號碼的第一位數只有1(男生)、2(女生)兩種可能,當然就不符合Benford’s law。但是例如文章一開始的例子「你身上有多少錢」,或者是「你家門牌號碼幾號」,這樣的數字如果收集得夠多,就會符合Benford’s law。
其他像是「財務報表」上面的數字也會符合——這就很有用了,事實上也曾經有利用Benford’s law抓到逃稅、作假帳的案例。由於Benford’s law並非「直覺上想當然耳」的分布,而人類心理上作假時,會有「避免極端值」的傾向,因為覺得數字太極端會產生「槍打出頭鳥」的結果,所以在竄改數據時,首位數用了太多的4, 5, 6等中間數,違反了「頭文字1」的法則,結果就被逮到了,現在有一些會計軟體已經內建Benford’s law的檢測,這也算是物理學家對社會科學的貢獻吧!
當然,如果造假者知道這個定律,就會把假數據修正到符合Benford’s law了吧,所以念物理真的很重要!(這什麼結論…)
這個定律也在2009年伊朗的總統大選中登場,由現任總統Mahmūd Ahmadinezhād 贏得連任的這場選舉充滿了爭議,舞弊的指控滿天飛,還引發了「綠色革命」的抗爭,有高達300萬人在德黑蘭示威,後來有36人喪生,4000多人被捕。舞弊指控中一個證據就是有一位落選人Karoubi在各個選區的得票數分布,頭文字是7的比例異常的高,違反了Benford’s law。最後的結果呢?只證明了科學無法解決政治問題,Mahmūd Ahmadinezhād 還是在國內爭議與國際譴責中當到2013年卸任。
2009年伊朗大選,落選人Mehdi Karroubi在各區得票數的首位數字分布M,黑色為Benford’s law,灰色為實際分布。(來源:維基百科,CC BY 3.0)
最近的新聞(是什麼新聞不能說,怕被關站)開始有一些關於Benford’s law的報導了,在此幫看不懂的網友們服務一下囉!
Newcomb發表在American Journal of Mathematics 的論文(1881):http://www.uvm.edu/pdodds/files/papers/others/1881/newcomb1881a.pdf
Benford 發表在Proceedings of the American Philosophical Society的論文(1938):https://www.jstor.org/stable/984802
為什麼會看到廣告
avatar-img
158會員
149內容數
以中二魂介紹最新的科學與科技發展,幫你讀剛出爐的最新學術期刊論文,若宅味過重敬請原諒!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
很多小夥伴不解自己八字不錯,有財有官又有印,但實際上工作與財運卻是差強人意,難道八字不準?這是因為他忽略了其他條件,古人會說一命二運三風水四積陰德五讀書,就是要告訴我們【命】只是一個基礎,他會因後面其他條件而改變。 用個通俗點的例子,就像打麻將,【本命】只是你開局拿到的牌,而【運】就是你每輪摸到的
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 1.2.5 弦的振動 六 當時研究離散系統的丹尼爾.貝努利 (Daniel Bernoulli﹔約翰•貝努利的兒子) 可能受到一
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 1.2.5 弦的振動 一 前文提到萊布尼茲與瑞士數學家約翰‧貝努利有過關於「函數」的通訊。現在談一下貝努利。 貝努利關心的其中
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 四 牛頓的「流數」不久便淡出歷史的舞台,後來的數學工作者選擇了萊布尼茲比較抽象的「函數」。 公元1673年,萊布尼茲在一篇名為〈觸線
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 一 踏入公元十七世紀,微積分逐漸成形,而主要的貢獻來自德國數學家及哲學家萊布尼茲和英國數學家及物理學家牛頓。27 但兩人發展微
  譬如說,人們在以帕德嫩神廟為典範的人造物與鸚鵡螺為典範的生物構造上,都找到了1.618的黃金分割率。而科學家也在部分植物的枝條數目與花瓣數目上找到費波那契數列。對於相信與熱愛數學的一些人來說,這無疑是「大自然以數學構造」之鐵證。但對另外一些人而言,這只不過是某種「幸運數字」。
Thumbnail
作者 Only 系列文章,【一天一千字,進化每一次】,說明牛頓是物理學家,對人類文明演進有重要影響。然而,牛頓晚年竟然是破產。投資南海泡沫,牛頓失去了大量財富。這段經歷告訴我們,投資不僅是數學與科學,更像是心理學跟哲學,甚至蘊含著藝術的成分。
今天,很難得地沒有情緒,思維也一片空白。所以就不去批評什麼人事物,來談談我從歷史學得的一些假設跟可能! 干支不是玄學專用的,就很單純的是一種算術應用,十進位法,跟十二進位法。 世界各個文明都是單一進位法,而且是十進位法,畢竟十根手指頭就在那裡。為什麼中國人會用到兩種進位法呢? 應該是當初有一個
Thumbnail
只用描述的各位恐怕還是會有些霧煞煞喔,這裡我們用第一數當作範例,來帶各位跑一次。 天干順序是:甲、乙、丙、丁、戊、己、庚、辛、壬、癸。 對應數字是:1、2、3、4、5、6、7、8、9、10。 假設今天你第一個數字取出來是1,第二個數字取出來也是1,那麼對應天干就是甲、甲,所以就要翻到甲
Thumbnail
"管過去它做了什麼"是絕對不對的觀念,不是只有政治而已,而是為人處世必須要小心萬劫不復的陷阱。 在數學或流行病統計上有一個叫做貝氏定理,應用在觀察一個人,則相當於觀察他失去信任的過程。
Thumbnail
很多小夥伴不解自己八字不錯,有財有官又有印,但實際上工作與財運卻是差強人意,難道八字不準?這是因為他忽略了其他條件,古人會說一命二運三風水四積陰德五讀書,就是要告訴我們【命】只是一個基礎,他會因後面其他條件而改變。 用個通俗點的例子,就像打麻將,【本命】只是你開局拿到的牌,而【運】就是你每輪摸到的
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 1.2.5 弦的振動 六 當時研究離散系統的丹尼爾.貝努利 (Daniel Bernoulli﹔約翰•貝努利的兒子) 可能受到一
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 1.2.5 弦的振動 一 前文提到萊布尼茲與瑞士數學家約翰‧貝努利有過關於「函數」的通訊。現在談一下貝努利。 貝努利關心的其中
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 四 牛頓的「流數」不久便淡出歷史的舞台,後來的數學工作者選擇了萊布尼茲比較抽象的「函數」。 公元1673年,萊布尼茲在一篇名為〈觸線
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 1.2.4 微積分的記法 一 踏入公元十七世紀,微積分逐漸成形,而主要的貢獻來自德國數學家及哲學家萊布尼茲和英國數學家及物理學家牛頓。27 但兩人發展微
  譬如說,人們在以帕德嫩神廟為典範的人造物與鸚鵡螺為典範的生物構造上,都找到了1.618的黃金分割率。而科學家也在部分植物的枝條數目與花瓣數目上找到費波那契數列。對於相信與熱愛數學的一些人來說,這無疑是「大自然以數學構造」之鐵證。但對另外一些人而言,這只不過是某種「幸運數字」。
Thumbnail
作者 Only 系列文章,【一天一千字,進化每一次】,說明牛頓是物理學家,對人類文明演進有重要影響。然而,牛頓晚年竟然是破產。投資南海泡沫,牛頓失去了大量財富。這段經歷告訴我們,投資不僅是數學與科學,更像是心理學跟哲學,甚至蘊含著藝術的成分。
今天,很難得地沒有情緒,思維也一片空白。所以就不去批評什麼人事物,來談談我從歷史學得的一些假設跟可能! 干支不是玄學專用的,就很單純的是一種算術應用,十進位法,跟十二進位法。 世界各個文明都是單一進位法,而且是十進位法,畢竟十根手指頭就在那裡。為什麼中國人會用到兩種進位法呢? 應該是當初有一個
Thumbnail
只用描述的各位恐怕還是會有些霧煞煞喔,這裡我們用第一數當作範例,來帶各位跑一次。 天干順序是:甲、乙、丙、丁、戊、己、庚、辛、壬、癸。 對應數字是:1、2、3、4、5、6、7、8、9、10。 假設今天你第一個數字取出來是1,第二個數字取出來也是1,那麼對應天干就是甲、甲,所以就要翻到甲
Thumbnail
"管過去它做了什麼"是絕對不對的觀念,不是只有政治而已,而是為人處世必須要小心萬劫不復的陷阱。 在數學或流行病統計上有一個叫做貝氏定理,應用在觀察一個人,則相當於觀察他失去信任的過程。