【資料科學家的數學基礎課 | 第13課】常態分布解密:為什麼成績大多落在平均分附近?

更新 發佈閱讀 2 分鐘

你以為的「隨機」其實有形狀

走進咖啡廳,你可能會發現今天的咖啡比昨天淡。這真的是店員手抖嗎?

又或者,你回想上次段考:明明有人考很高、有人很低,但大多數人卻聚在中間。 這些看似「隨機」的現象,其實都有數學的影子──那就是 機率分布


生活裡的三種分布

數學課本裡的機率公式很抽象,但如果換個角度,其實我們每天都被機率分布包圍。

  • 骰子遊戲 = 均勻分布:每一面出現的機會一樣大,就像一個「平坦的長條圖」。
  • 考試成績 = 常態分布:大多數人會集中在平均附近,兩端少數「特高/特低」。
  • 咖啡濃度 = 波動卻有規律:每天略有差異,但長期下來,會呈現鐘型曲線。

原來,「隨機」並不等於「亂」,而是隱藏著某種形狀。


把隨機畫成圖:PMF 與 PDF

(想像一張骰子的長條圖,六個柱子等高;另一張是鐘型曲線。)

  • PMF:像一袋糖果,每個點是一顆糖果的機率,全部加起來 = 1。
  • PDF:像一條平滑曲線,真正代表機率的是曲線下的面積,而不是高度。

數學只要記住這兩句話

數學家用兩條公式,把「隨機」壓縮成最簡單的規律:

raw-image
  • 離散分布(骰子、抽獎):所有點加起來剛好=1。
  • 連續分布(身高、咖啡濃度):曲線下的面積=1。

誤解:隨機 = 沒規律?

很多人以為「隨機 = 完全沒規律」。但其實:

  • 骰子短期可能連續丟出 6,但長期次數會逐漸均勻。
  • 個人考試成績看起來隨機,但整體學生分布卻很穩定地呈現鐘型。

👉 真相是:短期不可預測,長期卻很穩定。


下一步:那第 11 次抽卡有沒有比較大機率?

所以,機率分布就像一張地圖,告訴我們「隨機」的形狀。

下一篇,我會聊 條件機率:如果前十次抽卡都沒中,第 11 次真的比較有希望嗎?

留言
avatar-img
溫蒂的夢幻島航海日誌
1會員
19內容數
我是 Wendy,一位相信知識可以讓世界更美好的學習者。 白天是品保工程師,晚上是資料筆記的整理者。 正在深入統計與品質管理,也持續探索資料科學與商業邏輯的連結。 偶爾也會記錄家庭經營、親子對話與自由工作者的嘗試。 每一篇文章,都是給自己的備忘錄,也希望成為你前行路上的地圖。
2025/08/18
公司讀書會,不只是交流讀後感,而是幫助部門努力被看見的舞台。書本是媒介,真正價值在於把觀點轉化為部門成果,並與公司方向對齊。懂得善用這個平台,不僅能提升團隊能見度,更能展現領導格局。
Thumbnail
2025/08/18
公司讀書會,不只是交流讀後感,而是幫助部門努力被看見的舞台。書本是媒介,真正價值在於把觀點轉化為部門成果,並與公司方向對齊。懂得善用這個平台,不僅能提升團隊能見度,更能展現領導格局。
Thumbnail
2025/08/13
一台號稱 90% 成功率的新咖啡機,第一杯卻煮壞了?頻率派會說「只是運氣差」,貝氏派卻立刻調整信心。這篇用咖啡故事拆解機率、隨機變數與機器學習的不確定性,還有小測驗挑戰你是哪一派喔。
Thumbnail
2025/08/13
一台號稱 90% 成功率的新咖啡機,第一杯卻煮壞了?頻率派會說「只是運氣差」,貝氏派卻立刻調整信心。這篇用咖啡故事拆解機率、隨機變數與機器學習的不確定性,還有小測驗挑戰你是哪一派喔。
Thumbnail
2025/08/11
對程式新手或文組轉職者來說,Git、GitHub、IDE 常令人困惑。其實IDE 像是寫程式的桌子,Git 是記錄版本的日記,GitHub 是作品展覽廳。也可以用 Google Colab 寫 Python,直接存到 GitHub,先從簡單方法開始,讓程式碼管理更完整,也為履歷加分。
Thumbnail
2025/08/11
對程式新手或文組轉職者來說,Git、GitHub、IDE 常令人困惑。其實IDE 像是寫程式的桌子,Git 是記錄版本的日記,GitHub 是作品展覽廳。也可以用 Google Colab 寫 Python,直接存到 GitHub,先從簡單方法開始,讓程式碼管理更完整,也為履歷加分。
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
常態分配:常見事物的分配 我們透過觀察可以知道很多事物的分配呈現常態分配,例如:IQ、身高、兩顆骰子擲的點數等等。不管是間接變項或是連續變項,只要分配呈現左右對稱就可以稱之為常態分配。 常態分配為什麼重要 就像我們剛剛所說的,世界上許多事情是常態分配,所以當我們不確定我們要推論的事情是什麼分配
Thumbnail
常態分配:常見事物的分配 我們透過觀察可以知道很多事物的分配呈現常態分配,例如:IQ、身高、兩顆骰子擲的點數等等。不管是間接變項或是連續變項,只要分配呈現左右對稱就可以稱之為常態分配。 常態分配為什麼重要 就像我們剛剛所說的,世界上許多事情是常態分配,所以當我們不確定我們要推論的事情是什麼分配
Thumbnail
集中趨勢指標:數據集中的狀況 眾數 mode 最多樣本的數值,也有可能沒有 中位數 median 數據排序後排名最中間的數值。奇數個樣本:(N+1)/2。偶數個樣本:[N/2+(N+1)/2]/2 平均數 mean 全體數值加總除以樣本數。樣本平均數是最佳估計者,具有不偏性(unbias
Thumbnail
集中趨勢指標:數據集中的狀況 眾數 mode 最多樣本的數值,也有可能沒有 中位數 median 數據排序後排名最中間的數值。奇數個樣本:(N+1)/2。偶數個樣本:[N/2+(N+1)/2]/2 平均數 mean 全體數值加總除以樣本數。樣本平均數是最佳估計者,具有不偏性(unbias
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
我們每天都會接觸到龐大的數據量,但多數人未必知道如何正確地解讀。在這本《一次看懂小數據》中講述了我們該如何解讀每天接觸到的資料,將複雜的問題變得更簡單和直觀?如何避免陷入面對數據常犯的錯誤與盲點?在這篇文章中,我歸納整理的三個重點。
Thumbnail
我們每天都會接觸到龐大的數據量,但多數人未必知道如何正確地解讀。在這本《一次看懂小數據》中講述了我們該如何解讀每天接觸到的資料,將複雜的問題變得更簡單和直觀?如何避免陷入面對數據常犯的錯誤與盲點?在這篇文章中,我歸納整理的三個重點。
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News