機率密度函數

閱讀時間約 6 分鐘

今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。

擲骰子 vs 量身高

前面的文章中, 我們有提過定義域的概念, 在機率的世界裡, 機率函數的定義域就是所有可能發生的情況, 透過隨機變數轉成的數字, 全部綁在一起叫做定義域。比方說, 我們投擲一個硬幣, 結果可能會出現正面或反面, 透過隨機變數分別將其轉成0或1, 因此投擲硬幣的機率函數定義域就是0和1, 根據機率的基本性質, 這兩個點的機率加起來必須要等於1。同理擲骰子時, 可能出現的點數為1~6, 因此擲骰子的機率函數定義域就是123456,這六個點的機率加起來必須要等於1。這樣的定義方式雖然很直觀, 卻並非毫無破綻, 舉個例子: 身高。現實生活中應該沒有人會問你說: 今天我到台北車站隨機抽一個人, 他的身高是172公分的機率是多少吧! 而是會說: 今天我到台北車站隨機抽一個人, 他的身高介於170-175公分之間的機率是多少?

差在哪裡?

為什麼呢? 因為在問身高時, 我們其實並不會太在意對方身高的精確值到底是多少, 而是差不多就好, 畢竟我們也不會無聊到真的帶一台量身高的儀器, 上街幫路人做健康檢查。如果從較嚴謹的角度來看, 雖然理由並非如此, 但這麼做依然是對的, 還有這麼做也是不得已的。試想, 假設今天你找到一個路人, 他身高是172公分的機率是0.05, 那他身高是172.1的機率呢? 172.33呢? 172.3535呢? 只要我一直往小數點後追問, 機率就要一直下修, 直到全部都是0 (雖然我們平常報身高頂多報到小數點後一位, 但那不代表我的身高就是這樣, 會這樣報除了儀器本身的測量極限外, 也因為再多加幾位小數點, 報的更精準一點意義也不大)。

眼尖的觀眾可以看出其中的差別, 因為身高是連續的, 擲銅板或骰子是的情況是離散的, 並不是因為身高有171, 172, 173… 比較多種, 所以我可以不斷地往下去切得更細, 才會造成每個身高的機率值都是0。那如果想說的嚴謹一點, 我們會怎麼說呢? 機率密度, 這個密度就取材於物理課本中密度的概念。我們都知道質量等於密度乘上體積, 但當我們把一塊木頭切得很小很小, 讓他體積變成0的時候, 他的質量就變成0了, 但他的密度還在, 所以我們可以改從密度的角度來了解他 (註:當這塊木頭的質量不是平均散布在每個地方的時候, 我們切出來的每一小片密度並不會相同)。

除了密度之外, 我們還能怎麼說呢? 如果每次跟別人交流, 我都要講這麼一長串很累耶, 而且機率的觀念對我來說比較直觀, 機率密度相較之下比較不直覺。有的, 答案就是不要切的那麼細, 只要讓木頭保留一點點體積, 他就有質量了, 機率的部分也是如此, 只要我們不要只聊一個數字, 而是從區間來談這件事, 他就會變回機率了。但其實就算大家不知道這些東西, 一般也會使用正確的用詞, 比方說: 這個是常態分配, 我們從平均值往外加減兩個標準差, 百分之九十五的人都會落在這個區間。除了身高外, 體重, 時間等, 只要你可以無限細分尺度的東西, 都是同一個道理。

 

在這裡會有兩個需要較多數學基礎才能理解的問題, 第一, 每個點機率都是0那一堆0加在一起怎麼就有機率了呢? 第二, 如果每個點的機率都是0, 那我從0到1之間隨便選一個數, 我總會選到一個吧, 但他被選到的機率是0欸, 這又是怎麼一回是呢? 這就留給大家如果有興趣的話自行研究啦!

Binomial 分配的極致

在上篇文章中, 我們有提過Binomial機率模型, 這個模型的故事是我投擲一個硬幣5次, 出現正面的次數有幾次。那如果我多投一點, 投個10次, 100次, 1000次, 或是再更多呢? 這時候我們會發現每個數字出現的機率開始越來越低, 與此同時, 二項分配也會漸漸趨於常態分佈, 只要n足夠大, 他就會趨近於期望值是np, 變異數是np(1-p)的常態分配。

但這時候會有一個問題, 二項分配中的期望值為np (投擲次數乘上機率), 而p是固定的, 當n放大到無限時, np就會放大到無限, 此時, 若我們將這個n是無限大的二項分布, 拿常態分配套上去時, 就會遇到一個問題, 期望值不知道要放多少, 標準差也不知道要放多少, 那這時候我們該怎麼辦呢? 答案就是: 標準化, 我們將他減掉期望值, 除以標準差後, 就可以將他轉成標準常態 (這是根據中央極限定理, 而非常態近似, 操作的細節也需要一點數學基礎, 但這相對容易一點, 之後的文章裡應該會提到)。

舉例

Exponential: 在路邊等計程車的過程中, 假設平均每半小時經過一輛, 而你所需要等待的時間為X (分鐘), 此時X的機率密度函數為:

raw-image

其實大致上的架構跟之前離散時是一樣的, 只是必須將機率改成機率密度。

(連續型機率密度函數最經典的例子是常態分配, 但由於有太多東西可以談, 因此想另外開一個篇章)

這時如果我們想要知道關於機率的訊息, 就會將問題改為我需要等待超過15分鐘的機率是多少, 就會發現想把這個函數從0加到15需要做積分

raw-image

如果你不會積分或是懶得算的話, 建議使用wolframe alpha (在不要求計算過程的情況下, 這個軟體在網路上是免費資源, 為什麼提到計算過程呢? 這算是黑魔法的一部份, 請恕我不公開, 各位讀者自行領略, 或是如果未來我們有機會有私底下的接觸, 再偷偷告訴你)。

小結

今天的內容相較之下比較無趣, 我們介紹了機率密度函數與機率函數的差別 (也有些教材會將機率函數稱為機率質量函數, 對應文中密度與質量的說法), 希望大家之後不幸遇到會在這個點上跳針的人時, 就多體諒他們一些吧, 畢竟這些人從小就是被這樣訓練的。此外, 我們提供了一個簡單的範例, 也埋下了許多坑, 不過今天就先這樣吧, 我們下篇文章見。

2會員
8Content count
留言0
查看全部
發表第一個留言支持創作者!
MC 統計的沙龍 的其他內容
Essentially, all models are wrong, but some are useful. 既然模型都是錯的,那我們還學這些要幹嘛呢?
上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
Essentially, all models are wrong, but some are useful. 既然模型都是錯的,那我們還學這些要幹嘛呢?
上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
你可能也想看
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
這本書在我到書單中躺了很久,近期常常會思考著機率與人生際遇的關係,在某個人事物的環境下,為什麼會遇到很特別的,尤其是專家所宣稱的低機率事件發生,或是遇到環環相扣的巧合,這個疑問充滿著我的內心,這本書帶給我一些獨特的觀點去切入觀察,我先從基本知識探討信賴區間的本質開始談起。
Thumbnail
機率,一個我們從小就會接觸到的名詞。 在開啟交易新手村的時候,便發現自己其實很不喜歡機率這件事,並非我不相信而是自己認為的機率只有0%或是100%。 其中的1%~99%我都認為它們不存在,但現在我已經慢慢接受這件事了。 但我發現人們對於機率的解讀存在著「巨大的差異」。(這實在是太有趣啦啦啦啦!) 例
Thumbnail
西方現代化的進程開始於17世紀, 它是天才世紀-一個需要天才而天才雲集的世紀。文藝復興及宗教改革使西方從中古過渡到近現代; 到了17世紀上半葉, 中古的神學和哲學知識體系漸被揚棄, 人的任務轉為認識自然及認識人。 這種認識體現為哲學革命和科學革命-包括機率和統計的誕生。它們標誌著人類理性的偉大勝利。
Thumbnail
最幸福的日子莫過於 撕開新買的菸的包裝 塑膠,咬破,帕擦, 與愛人避開傾斜的雨, 但傾斜的我把愛與訴說在煙霧裡 輕微淋濕的袖口 凝視著他濕透的瞳孔 菸灰在燒灼時墜落 …
Thumbnail
有些人因為堅信善有善報、惡有惡報的道德觀,而在努力做好事後遇到大不幸,開始認知失調,甚至可能懷疑自己曾經做過壞事而受到報應。然而命運是機率系統,並不是因果業報,短期會受到隨機性影響,長期則受到正偏態與厚尾效應影響。
恐怖的機制, 有時直接給, 有時傾家蕩產還不給。
Thumbnail
只要是估算,就會有誤差,因此投資者應該與「不確定」和平共處,而不是夢想找到一個完美神準模型。
Thumbnail
如果下面這兩個選項只能選一個,你會如何做選擇? 每天額外工作1小時,就可以穩穩拿到A選項的1萬元收入,或是一半機率可能拿到5倍收入,一半機率可能白忙一場什麼都沒有...
Thumbnail
  不知從何時開始,有了看科普的影片的習慣。我對天文、物理與哲學類的影片比較有興趣,即使是理解不了的數學類影片,還是會放空地看完。總自以為花個幾分鐘就會變得更聰明,催眠自己「滑手機不一定是在浪費時間」。每天熄燈後,都得看上一、兩部才睡得著,就像無論膀胱有無尿液,都要去廁所擠一擠,才能算是結束完整的一
Thumbnail
<p>台灣第一部醫院漫畫,由雷亞及兩元兩位老師共同創作,漫畫中充滿爆笑的醫院故事,讓你用歡樂逗趣的方式學習正確醫學知識。</p>
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
這本書在我到書單中躺了很久,近期常常會思考著機率與人生際遇的關係,在某個人事物的環境下,為什麼會遇到很特別的,尤其是專家所宣稱的低機率事件發生,或是遇到環環相扣的巧合,這個疑問充滿著我的內心,這本書帶給我一些獨特的觀點去切入觀察,我先從基本知識探討信賴區間的本質開始談起。
Thumbnail
機率,一個我們從小就會接觸到的名詞。 在開啟交易新手村的時候,便發現自己其實很不喜歡機率這件事,並非我不相信而是自己認為的機率只有0%或是100%。 其中的1%~99%我都認為它們不存在,但現在我已經慢慢接受這件事了。 但我發現人們對於機率的解讀存在著「巨大的差異」。(這實在是太有趣啦啦啦啦!) 例
Thumbnail
西方現代化的進程開始於17世紀, 它是天才世紀-一個需要天才而天才雲集的世紀。文藝復興及宗教改革使西方從中古過渡到近現代; 到了17世紀上半葉, 中古的神學和哲學知識體系漸被揚棄, 人的任務轉為認識自然及認識人。 這種認識體現為哲學革命和科學革命-包括機率和統計的誕生。它們標誌著人類理性的偉大勝利。
Thumbnail
最幸福的日子莫過於 撕開新買的菸的包裝 塑膠,咬破,帕擦, 與愛人避開傾斜的雨, 但傾斜的我把愛與訴說在煙霧裡 輕微淋濕的袖口 凝視著他濕透的瞳孔 菸灰在燒灼時墜落 …
Thumbnail
有些人因為堅信善有善報、惡有惡報的道德觀,而在努力做好事後遇到大不幸,開始認知失調,甚至可能懷疑自己曾經做過壞事而受到報應。然而命運是機率系統,並不是因果業報,短期會受到隨機性影響,長期則受到正偏態與厚尾效應影響。
恐怖的機制, 有時直接給, 有時傾家蕩產還不給。
Thumbnail
只要是估算,就會有誤差,因此投資者應該與「不確定」和平共處,而不是夢想找到一個完美神準模型。
Thumbnail
如果下面這兩個選項只能選一個,你會如何做選擇? 每天額外工作1小時,就可以穩穩拿到A選項的1萬元收入,或是一半機率可能拿到5倍收入,一半機率可能白忙一場什麼都沒有...
Thumbnail
  不知從何時開始,有了看科普的影片的習慣。我對天文、物理與哲學類的影片比較有興趣,即使是理解不了的數學類影片,還是會放空地看完。總自以為花個幾分鐘就會變得更聰明,催眠自己「滑手機不一定是在浪費時間」。每天熄燈後,都得看上一、兩部才睡得著,就像無論膀胱有無尿液,都要去廁所擠一擠,才能算是結束完整的一
Thumbnail
<p>台灣第一部醫院漫畫,由雷亞及兩元兩位老師共同創作,漫畫中充滿爆笑的醫院故事,讓你用歡樂逗趣的方式學習正確醫學知識。</p>