“數大”便是美,碧綠的山坡前幾千隻綿羊,挨成一片的雪絨,是美;一天的繁星,千萬隻閃亮的眼神,從無極的藍空中下窺大地,是美;泰山頂上的雲海,巨萬的雲峰在晨光裏靜定著,是美…
在徐志摩《西湖記》中的這段話, 描述著事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
建立比較基準
假設測驗只進行一次, 你就沒有辦法測出自己真正的實力。舉個例子, 假設桌上有一疊樸克牌, 其中有二十張3和一張K, 在不知道裡面有什麼牌的情況下, 你從中抽出一張牌, 抽到了K, 你就會認為這二十一張牌的數字都很大。如果你抽兩次, 你會抽到一張三和一張K, 這時候就會開始懷疑裡面到底有哪些牌, 你可能會有各種想法, 但我敢打賭你不會猜裡面是二十張3一張K, 或是二十張K一張3。但如果從中抽出三張, 抽到了兩張三和一張K, 這時就算自我感覺良好, 也會傾向於猜裡面是小牌比較多吧, 再極端一點, 假設你抽了二十張, 裡面有19張3和一張K, 你會猜蓋在桌上的那張牌是什麼呢?
多抽幾張牌有其必要性, 在只進行一次的情況下, 你都不會知道你抽到的大牌, 是因為運氣好還是整疊牌都很大, 透過多抽幾張牌我們就能大致刻畫出整疊牌的樣貌, 這時候再下判斷就會準確許多。在日常生活中也是如此, 假設我們只進行一次實驗, 你很難判斷你的好表現是因為你實力本來就很好, 還是這次剛好翻到比較好的牌, 相反的, 你也不知道你表現得不好, 是因為實力不好, 還是只是這次運氣比較差。因此在統計學上我們會傾向多做幾次實驗, 然後用這幾次實驗數據的平均數或中位數來代表實驗結果。
蒙地卡羅模擬
除了統計學有認識群體未知特性的需求外, 我們也能透過隨機性, 反覆進行多次實驗, 來處理數學或是工程學上的問題。最常見的例子就是個你從小接觸到大的數字: pi, 大家應該都知道他是3.14, 但你知道他是怎麼算的嗎? 以小學的數學課本來說, 我們學到的做法是拿圓周長除以直徑, 接下來, 我將提供你另一種方法。
首先, 我們在紙上畫出一個2*2的正方形, 在正方形裡畫一個半徑為1的圓, 然後開始射飛鏢, 射個50000次之後, 我們算算看有多少隻鏢成功地射在圓裡面, 拿射在裡面的支數除以50000, 再乘以4, 就可以得出3.14159這個數字, 是不是很神奇呢? 看到這裡, 你心裡可能會產生兩個疑問, 第一, 我直接拿圓周長除以直徑不是比較快嗎? 第二, 射50000次飛鏢很累耶, 還要一個一個記下來。
關於第一個問題的答案是, 圓周率只是個比較方便理解的舉例, 有這個概念後, 我們可以拿它來計算較難的數學問題, 比如: 根號二, 如果層級再往上拉高, 我們也可以用類似的技巧來解難以用紙筆計算的積分問題。至於第二個疑問, 其實這個方法是伴隨電腦的發明而被提出來的, 因此射50000次飛鏢並不是要你真的去射那麼多次, 而是創造一個虛擬的情境, 利用電腦去模擬即可。除此之外, 有些物理學, 金融工程, 或是總體經濟學的東西, 我們不能等到結果出來才意識到現在升息, 會導致多少銀行面臨流動性風險, 多少銀行倒閉, 多少人失業, 對整個社會產生多大的影響, 這時候就會有經濟學家透過類似的方法, 在電腦裡讓跑模擬, 估計政策執行所帶來的影響。
觸發小機率事件
反覆實驗還有另一種好處(?) 就是可以觸發小機率事件, 機率很小的事情不是不會發生, 只要你實驗的次數夠多, 就一定會看到, 其實古人很早就知道這件事了, 所以才會留下, “夜路走多了, 總會碰到鬼”, “勿以惡小而為之, 勿以善小而不為” 這樣的說法。接下來, 我們來看看數學家怎麼說。
如果給猴子一台打字機讓他隨便亂按,只要時間夠長,就必然能產出莎士比亞的作品。當然, 如果就單一隻猴子而言, 也許產生莎士比亞作品所需的時間很長很長, 但這是個資本主義的社會, 我們可以花錢多聘請幾隻猴子,。然而, 即使我們可以快速產生出莎士比亞作品, 它依然無法取代莎士比亞, 因為產生一部完整的作品前, 可能會先生成無數的失敗品, 至於該如何海量的失敗品中挑出成功的那一部, 變成了另一個大問題。
網路科技的發達讓我們進到了資訊爆炸的時代, 資訊的取得不再像從前那麼困難, 隨後自媒體興起, 大家開始在社群平台上瘋狂的發布內容, 雖然我們不像猴子隨機亂按, 但鋪天蓋地而來的作品, 卻同樣造成了讀者篩選上的困難。而且日後AI會加入戰局, 就很像有無限隻猴子坐在打字機前瘋狂的亂敲, 該如何與之競爭, 成了創作者很大的難題。
站在機率的角度來看, 我們提供以下兩點想法: 1. 拉長作品平均長度, 一篇文章從500字拉長到1000字, 對你來說也許是2個小時的事, 但對隨機生成的AI來說, 可能要多好幾個月才辦的到。2. 採取部分觀點跟主流媒體有所不同的策略。根據大家到目前為止的觀察, 現行的AI其實是利用網路上的文本去訓練的, 也就是說它並不是完全隨機生成這些內容的, 只要我們稍微避開它的學習內容, 就很容易做出它做不出來的東西。當然, 凡事有利有弊, 採取這樣的策略可以跟AI做出區別, 但市場是否願意買單, 就是另一回事了。
結語
我們解釋了重複進行實驗的重要性, 接下來, 我們從機率的其中一個特質切入, 帶大家看看我們可以如何運用這項性質, 以及他如何影響我們的生活, 這些都是建立在大量的樣本數上, 也就呼應了一開始引用徐志摩的那段話 "數大"便是美。
最後問問大家, 生活中有哪些事情是可以被打字機前的猴子做出來的呢?