接續
前一篇關於「Benford’s Law」...為什麼數字的第一位數經常會滿足這樣的分布呢?首位數為 1 的佔 30.1%,2 為 17.6%....P(d) = log(1+1/d)。我們不做嚴謹的數學討論,用一個簡單的例子來說明,為什麼越小的數字越容易出現在第一位數。
小時候我們都背過九九乘法表,從 1 到 9 之中任意選出兩個數乘起來,我們可以「不經大腦」,很快的說出答案。那我們來看看這個表,數一下它們的「頭文字」,會發現什麼呢?
圖一:九九乘法表,最下面一列是這 81 個數字中,首位數為 1-9 各自出現的次數。
從 1 到 9 出現在首位數的機率跟 Benford’s Law 類似,1 最大,然後遞減。其中 1 出現的機率是 22.2%,比 Benford’s Law 的 30.1% 小一些,不過趨勢是一致的。接下來我們試試看「九九九乘法表」,也就是把 1 到 9 的任三個數字乘起來,一共有 729 種組合,數數看這 729 個數字的首位數,結果如下表所示:
圖二:第一列為數字 1-9,第二、四、六列(白底)為 9 個數字、99 乘法表、999 乘法表中,各個數字出現在首位的次數,第三、五、七列(淺藍底)是對應的機率,第八列(黃底)是 Benford’s Law。
各位可以發現,999乘法表裡面的首位數分布,已經十分接近 Benford’s Law 了!大家可以很容易想像,如果相乘的數字越多,9999 乘法表、99999 乘法表...首位數會越來越接近 Benford’s Law 的分布。
為什麼 1 到 9 被拿來乘的機率是均等的,而乘出來的結果卻是會讓首位數偏向小的數字呢?從圖一就可以看得出來,以九九乘法表中如果其中一個數字是 2 為例,另外一個數字是 5, 6, 7, 8, 9 都會讓乘出來的數都是以 1 開頭,顯然 1 佔了很大的便宜:只要數字「一大一小」,就很容易乘出「十幾」,也就是 1 開頭的數字,圖一中黃色的區域特別大塊,隨著兩個數字變大,各個數字「圍到的面積」就變小了。
上面用的是整數相乘的「窮舉法」,不過以此為基礎,如果我是任意抽出幾個隨機分布的數字來相乘,結果也會接近 Benford’s Law。在自然科學、社會科學、財經管理等領域出現的數字,很多都是來自「一堆數字的相乘」,大家回去翻翻物理課本,裡面的公式大部分都是乘法(除法也算是乘法的變形啦),所以量測一堆無關的物理量會出現 Benford’s Law 也就不意外,比如說我們
第 206 回討論到「發現外星人的機率 Drake equation」、「感染武漢肺炎的機率 Contagion Airborne Transmission Inequality」,就是一堆連乘。就算有加減法出現,由於我們只看第一位數,往往也是絕對值最大的那一項會在統計上支配了首位數字的分布。
到目前為止,Benford’s Law 仍然還不是一個被徹底瞭解的定律,一百多年來有許多科學家嘗試做一些解釋,不過大都有「在某種條件...」下的前提。這邊講的只是其中最簡單的一種,有興趣深入瞭解的網友,可以看一下這裡: