2023-07-30|閱讀時間 ‧ 約 7 分鐘

機率密度函數

今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。

擲骰子 vs 量身高

前面的文章中, 我們有提過定義域的概念, 在機率的世界裡, 機率函數的定義域就是所有可能發生的情況, 透過隨機變數轉成的數字, 全部綁在一起叫做定義域。比方說, 我們投擲一個硬幣, 結果可能會出現正面或反面, 透過隨機變數分別將其轉成0或1, 因此投擲硬幣的機率函數定義域就是0和1, 根據機率的基本性質, 這兩個點的機率加起來必須要等於1。同理擲骰子時, 可能出現的點數為1~6, 因此擲骰子的機率函數定義域就是123456,這六個點的機率加起來必須要等於1。這樣的定義方式雖然很直觀, 卻並非毫無破綻, 舉個例子: 身高。現實生活中應該沒有人會問你說: 今天我到台北車站隨機抽一個人, 他的身高是172公分的機率是多少吧! 而是會說: 今天我到台北車站隨機抽一個人, 他的身高介於170-175公分之間的機率是多少?

差在哪裡?

為什麼呢? 因為在問身高時, 我們其實並不會太在意對方身高的精確值到底是多少, 而是差不多就好, 畢竟我們也不會無聊到真的帶一台量身高的儀器, 上街幫路人做健康檢查。如果從較嚴謹的角度來看, 雖然理由並非如此, 但這麼做依然是對的, 還有這麼做也是不得已的。試想, 假設今天你找到一個路人, 他身高是172公分的機率是0.05, 那他身高是172.1的機率呢? 172.33呢? 172.3535呢? 只要我一直往小數點後追問, 機率就要一直下修, 直到全部都是0 (雖然我們平常報身高頂多報到小數點後一位, 但那不代表我的身高就是這樣, 會這樣報除了儀器本身的測量極限外, 也因為再多加幾位小數點, 報的更精準一點意義也不大)。

眼尖的觀眾可以看出其中的差別, 因為身高是連續的, 擲銅板或骰子是的情況是離散的, 並不是因為身高有171, 172, 173… 比較多種, 所以我可以不斷地往下去切得更細, 才會造成每個身高的機率值都是0。那如果想說的嚴謹一點, 我們會怎麼說呢? 機率密度, 這個密度就取材於物理課本中密度的概念。我們都知道質量等於密度乘上體積, 但當我們把一塊木頭切得很小很小, 讓他體積變成0的時候, 他的質量就變成0了, 但他的密度還在, 所以我們可以改從密度的角度來了解他 (註:當這塊木頭的質量不是平均散布在每個地方的時候, 我們切出來的每一小片密度並不會相同)。

除了密度之外, 我們還能怎麼說呢? 如果每次跟別人交流, 我都要講這麼一長串很累耶, 而且機率的觀念對我來說比較直觀, 機率密度相較之下比較不直覺。有的, 答案就是不要切的那麼細, 只要讓木頭保留一點點體積, 他就有質量了, 機率的部分也是如此, 只要我們不要只聊一個數字, 而是從區間來談這件事, 他就會變回機率了。但其實就算大家不知道這些東西, 一般也會使用正確的用詞, 比方說: 這個是常態分配, 我們從平均值往外加減兩個標準差, 百分之九十五的人都會落在這個區間。除了身高外, 體重, 時間等, 只要你可以無限細分尺度的東西, 都是同一個道理。

 

在這裡會有兩個需要較多數學基礎才能理解的問題, 第一, 每個點機率都是0那一堆0加在一起怎麼就有機率了呢? 第二, 如果每個點的機率都是0, 那我從0到1之間隨便選一個數, 我總會選到一個吧, 但他被選到的機率是0欸, 這又是怎麼一回是呢? 這就留給大家如果有興趣的話自行研究啦!

Binomial 分配的極致

在上篇文章中, 我們有提過Binomial機率模型, 這個模型的故事是我投擲一個硬幣5次, 出現正面的次數有幾次。那如果我多投一點, 投個10次, 100次, 1000次, 或是再更多呢? 這時候我們會發現每個數字出現的機率開始越來越低, 與此同時, 二項分配也會漸漸趨於常態分佈, 只要n足夠大, 他就會趨近於期望值是np, 變異數是np(1-p)的常態分配。

但這時候會有一個問題, 二項分配中的期望值為np (投擲次數乘上機率), 而p是固定的, 當n放大到無限時, np就會放大到無限, 此時, 若我們將這個n是無限大的二項分布, 拿常態分配套上去時, 就會遇到一個問題, 期望值不知道要放多少, 標準差也不知道要放多少, 那這時候我們該怎麼辦呢? 答案就是: 標準化, 我們將他減掉期望值, 除以標準差後, 就可以將他轉成標準常態 (這是根據中央極限定理, 而非常態近似, 操作的細節也需要一點數學基礎, 但這相對容易一點, 之後的文章裡應該會提到)。

舉例

Exponential: 在路邊等計程車的過程中, 假設平均每半小時經過一輛, 而你所需要等待的時間為X (分鐘), 此時X的機率密度函數為:

其實大致上的架構跟之前離散時是一樣的, 只是必須將機率改成機率密度。

(連續型機率密度函數最經典的例子是常態分配, 但由於有太多東西可以談, 因此想另外開一個篇章)

這時如果我們想要知道關於機率的訊息, 就會將問題改為我需要等待超過15分鐘的機率是多少, 就會發現想把這個函數從0加到15需要做積分

如果你不會積分或是懶得算的話, 建議使用wolframe alpha (在不要求計算過程的情況下, 這個軟體在網路上是免費資源, 為什麼提到計算過程呢? 這算是黑魔法的一部份, 請恕我不公開, 各位讀者自行領略, 或是如果未來我們有機會有私底下的接觸, 再偷偷告訴你)。

小結

今天的內容相較之下比較無趣, 我們介紹了機率密度函數與機率函數的差別 (也有些教材會將機率函數稱為機率質量函數, 對應文中密度與質量的說法), 希望大家之後不幸遇到會在這個點上跳針的人時, 就多體諒他們一些吧, 畢竟這些人從小就是被這樣訓練的。此外, 我們提供了一個簡單的範例, 也埋下了許多坑, 不過今天就先這樣吧, 我們下篇文章見。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.