統計急救箱─常態Z分數與Z檢定

Way

發佈於社會科學初心者的統計急救箱

2024/08/18 更新2024/06/24 發佈閱讀 9 分鐘

　　終於要開始講統計檢定的實作部分了。

　　其實我覺得之前我有點太急躁，先進入了t分數的概念介紹，現在又回來講Z分數的檢定操作順序不太對。為了讓順序比較恰當，這篇比較晚發的文章被設定成假設檢定後的下一篇。

　　希望未來的人看到的時候，順序會比較正確一些。

　　這篇前面還是帶到了前面幾篇講過的觀念，所以滿長的。已經了解前面概念的人，可以直接跳到「用實際數值做一次假設檢定」的段落開始看。

複習：假設檢定怎麼看？

　　還記得之前解釋過假設檢定的基本邏輯，我們現在來複習一下：

首先，我們知道常態分布曲線從中心往左右延伸各一個標準差，這個區間的數值發生機率為68%。如果延伸兩個標準差，這個區間的數值發生機率就是95%。如果忘記所謂的「這個區間的數值」實際上指的是什麼（其實就是X軸的值），可以回頭到統計急救箱─常態分布與假設檢定（上）裡面看喔。

　　所以現在我們應該知道怎麼解讀這兩張圖了：如果有一群資料的機率分布如同那個藍色面積的曲線（它正式的名字是──平均數為0且標準差為sigma的常態分布曲線），那麼我們得到觀察結果1的機率，應該介於68%到95%之間。

　　上面的原則說是說了，但怎麼好像還是聽不太懂...例如說那個觀察樣本的值（在X軸上的位置）到底是怎麼算出來的？或者那個68%的區間到底具體上是指哪裡到哪裡？可能會有這樣的困惑。

　　沒問題，我們就用實際的數值來看看吧！

用實際數值做一次假設檢定：找出臨界值 (CV)

　　首先，我們一定會從一群數值開始。假設現在我手上有五個人的某種資料...例如他們對自己工作滿意度的評分好了。這五個人的分數可以算出一個平均數，就是下面那橘色的人形。

好久不見這些小人了，平均數為-1，看起來他們不太喜歡自己的工作...

從這五個人身上得出一個平均分數，就如同之前介紹過抽球的例子一樣，像是從整體人群（一整袋球）之中抽出5個人（五顆球），並計算其平均分數。當我們重複做這件事情無數次之後，把每一次的結果畫成次數分配圖（或者機率圖），就會形成一個常態分配，我們稱之為抽樣分布。詳細的過程請見統計急救箱─抽樣分布與中央極限定理（二）。

　　在統計急救箱─抽樣分布與標準誤當中也有提到過，這種抽樣分布之所以很重要，原因就是：只要知道抽樣分布的平均數與標準差，我們就能計算觀察結果出現的機率。而根據假設檢定的概念，我們並不需要精確知道發生機率到底有多大，我們只要知道這個觀察結果發生的機率是不是很小，就能有比較充足的信心說：母體的平均是否和目前的觀測結果不同。詳細的邏輯推論過程，請見統計急救箱─常態分布與假設檢定（下）。

抽樣分布的平均數與標準差至關重要

　　而我們又已經知道當我們觀察得到的數值，也就是上面算出來工作滿意度的平均數，和「假設的」母體平均數之間有超過2個標準差的時候 (其實2個標準差只是近似值，後面會解釋)，表示若假設為真，這個觀測出現的機率極小，因此假設的母體平均數不正確的機率較高，稱之為拒絕虛無假設。

　　那當我們知道母體平均數是多少，也知道抽樣分布的標準差是多少的時候，這個問題就簡單得很了。我們來看看下圖，這是一個母體平均為0.5，抽樣分布標準差為0.25的常態曲線：

綠色線段所在的X軸位置，就是68%的臨界值

黃色線段則是95%的臨界值

可以非常簡單就算出，68%機率的區間應該是介於X軸上0.25~0.75的範圍之間，而95%機率則是介於0~1之間。這個區間的上下限，也就是上圖黃色虛線下方標記出的X軸數值，就是所謂的臨界值 (critical value, CV)。當超出這個臨界值的時候，我們就會知道如果虛無假設為真（也就是若母體平均為0.5），則觀察到目前結果的機率非常小（低於5%），因此推測母體平均不為0.5（拒絕虛無假設）。

　　如果覺得上面的這一串真的太拐彎抹角了，需要一個超級懶人包，那我只好整理出來（雖然不推薦用這種過於簡化的方式記憶）：

超出95%臨界值 → 獲得顯著的結果 → 拒絕虛無假設

所以最開始那五個人，他們的工作滿意度平均數就顯著的小於0.5。假如他們都是同一個公司的員工，那我們就可以推論這間公司的員工，工作滿意度分數可能是低於0.5分的 [*1]。

每次臨界值都要重算嗎？使用常態Z分數就不煩惱

　　就像上面演示的一樣，一旦知道母體平均數和抽樣分布的標準差，那找出臨界值就是輕而易舉。只要把母體平均數加、減兩倍的標準差，就可以得到95%機率的臨界值啦～

　　不過呢，這樣面臨到了一個麻煩 [*2]，那就是只要母體平均數和抽樣分布標準差不同（例如數學考試和英文考試有各自不同的母體平均和標準差），不就每次臨界值都要重算？超級無敵麻煩的啦！

　　不過...要解決「不同分數之間標準差和平均數不一致」這個困擾，好像在很～～～久之前曾經講過類似的事情。那就是把所有分數通通都轉換成「標準分數」就可以啦 (統計急救箱──標準分數)，只不過公式長得跟之前有點不同：

抽樣分布的Z分數公式

　　不過這個公式實際上怎麼用來解決剛剛的問題呢？我們先來理解概念，然後代換成剛剛例子中的實際數值就會比較好理解了。

符號解析

　　先來看看右邊的符號們。要記得，上面用來做虛無假設檢定的分布是抽樣分布，所以公式中的x bar (就是x上面有一個槓槓的符號) 就是這次觀測所得到的平均數（也就是五個人的工作滿意度平均數：-1）。

　　 mu則是母體平均數，這個應該不陌生了吧

　　分母的SD_{x bar}則是指「抽樣分布的標準差」，如果想知道這符號到底是怎麼寫成這怪樣子的，我放在文末補充的地方。

　　而公式左邊，則表示這是「x平均數的Z分數」。這是當然的，因為我們就是要把平均數轉換成Z分數嘛。

實際計算

　　知道每個符號都代表什麼意思後，我們來實際代入數字可能就會讓一切更清楚了。在剛剛的例子裡面，這次的五人工作滿意度平均分數為-1，從上面圖中可以看到母體平均數為0.5，抽樣分布標準差為0.25。

　　那麼！這次這五人的工作滿意度平均數，其Z分數為多少呢？答案就是 (-1 - 0.5) / 0.25，最後結果是 -6 喔~

轉換成Z分數的目的

　　還記得我們為什麼要把平均數轉成Z分數嗎？因為我們不想要每次母體平均數和抽樣分布標準差一改變，就要重新計算一次臨界值嘛。

　　而Z分數可以解決這個困擾。事實上，這個Z分數有個比較特別的名字，它叫做「常態化Z分數」，特別加上一個常態化就是要強調這是由一個常態分布（也就是抽樣分布）轉換成的Z分數 [*3]。

　　那麼常態化Z分數的95%臨界值究竟是多少？答案是正負1.96 [*4]。也就是下圖中那個95%的紅色箭頭，其真正涵蓋的X軸範圍是-1.96 ~ +1.96這個區間。看起來指到2的位置只是因為1.96和2太接近了，圖上面看不出來。

95%的範圍不是-2到+2喔！

同樣的，一個非常簡化的懶人包會這樣說：

如果確定這個Z分數是常態的，只要觀測到的Z分數值超過1.96或小於-1.96，就可以拒絕虛無假設。

　　上面這個過程，也就是所謂的Z檢定囉！

檢定結果

　　那麼，上面那五個人的工作滿意度平均分數 (-1)，在Z檢定裡面有沒有顯著的小於0.5呢？

　　因為我們剛剛算出來，他們工作滿意度的平均分數轉換為Z分數是-6。那-6有沒有小於-1.96？不只有，而且還差很多。這時候我們就會在統計報告裡面寫下面這段話：

Z檢定結果顯示工作滿意度分數顯著小於0.5，Z = -6.0, p < .05。

怎麼突然冒出那個p < .05啊？其實這個翻成中文的意思就是「機率 (p) 小於5% (0.05)」的意思。這5%怎麼來的呢？如果不知道的話可以參考統計急救箱─常態分布與假設檢定（下）的說明喔。

　　手上的專案應該快要上軌道了，希望能夠增加更新的頻率。

註解

[*1]: 其實不能這樣推論，因為五個人樣本實在太少了。這裡只是演示一下整個實作過程。

[*2]: 如果好奇為什麼「不知道母體平均和抽樣分布標準差是多少」不算是個麻煩，那只是因為這是下一篇的主題，而我不想在這裡破梗。

[*3]: 既然有常態化Z分數，就表示有非常態化的Z分數嗎？沒錯。事實上Z分數不會改變分布的長相，所以所謂的常態Z分數，就表示原本的分布就是常態的。那麼當然如果原本的分布不是常態的，轉成Z分數也不會是常態的囉～

[*4]: 正負1.96是常態Z分數的雙尾檢定95%臨界值 (如果比較不精準一點，就會進位變成2，這也是為什麼前面會用2來示範計算臨界值的原因)，雙尾檢定是社會科學裡面比較常用到的檢定。而至於單尾檢定，這個急救箱暫時沒有打算解釋那是什麼，但網路上應該有非常多資料可以參考。

補充

　　為什麼那個公式分母的SD旁邊的小足標要用x bar而不是x呢？這是因為「抽樣分布是由無數個x bar所組成的分布」。也就是說，組成抽樣分布的最小單位是x bar而不是x，所以要計算這個分布的標準差的時候，在足標加上x bar就是告訴讀者說：嘿！這個標準差是從x bar組成的分布得到的，而不是從x組成的分布所得到的喔！

　　如果上面這段看不懂也沒關係，因為這是比較抽象的解釋。繼續接觸統計的話，有天就會像是頓悟一般的懂了，至少我以前是這樣的。

致謝

本文所用圖片當中的素材來自於https://www.flaticon.com，由juicy_fish創作。

統計急救箱的沙龍社會科學初心者的統計急救箱

留言

留言分享你的想法！

統計急救箱的沙龍

75會員

32內容數

大學念文組，碩士班的報告突然要用統計了怎麼辦？沒學過統計怎麼寫量化學位論文？跟著統計書操作都沒問題，但報表都不知道在講什麼，也不知道做的分析到底對不對？作者在應用統計的路上跌跌撞撞也差不多十年了，希望有些心得可以幫助到有這些困擾的你。

統計急救箱的沙龍的其他內容

2024/12/29

統計急救箱─使用獨立t test的時機與前提

　　上回講了獨立樣本t test的運作原理，不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test，以及在什麼條件下可以使用獨立樣本t test？

2024/12/29

統計急救箱─使用獨立t test的時機與前提

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

看更多

你可能也想看

夢夢 🍰 甜點魔法

🎁 夢夢的蝦皮分潤開箱日記｜雙11購物攻略＆好物清單分享♡

嗨～我是夢夢 ♡ 每年到這個時候，我都會默默開始列購物清單畢竟「蝦皮雙11」真的太好買啦 🛒✨ 這次就想跟大家分享幾樣我自己平常有在用、也準備趁雙11補貨的好物，順便聊聊我最近開始玩的「蝦皮分潤計畫」，怎麼讓分享變成小小被動收入 💰

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

夢夢 🍰 甜點魔法

🎁 夢夢的蝦皮分潤開箱日記｜雙11購物攻略＆好物清單分享♡

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

騎著羊駝的摩托羅拉的沙龍

蝦皮分潤計畫-照顧多芬的神隊友

分享如何透過蝦皮解決毛孩（多芬）因換季和食物引發的皮膚過敏問題，從選用單一蛋白質的火雞肉主食，到利用寵物防舔衣舒緩傷口，並結合蝦皮雙11購物節的優惠資訊與蝦皮分潤計畫的實用教學。

2025/11/06

2025/11/06

　　雖然平均數可以拿來代表一群數值，但一整群數字之中還有另一個很重要的資訊，那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation，簡寫為SD) 就是在描述一群數字的分散程度。

2023/07/30

2023/07/30

上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。

2023/07/16

2023/07/16

IPQC 看過來， SPC 這樣學就對了（基礎篇）

在一場每週都要與客戶殊死的會議裡，看到了負責報告的 IPQC 在一道 SPC 監控的議題上應答失格，品保主管被 Call 出來救援結果也沒交代清楚，想當然耳就被客戶徹底電爆了。其實客戶生氣是有道理的，SPC 是 IPQC 的專業領域，怎麼會說不出製程要監控哪些 SPC 參數？

#SPC#IPQC#統計製程分析

2023/06/09

Warren Lo的沙龍

IPQC 看過來， SPC 這樣學就對了（基礎篇）

#SPC#IPQC#統計製程分析

2023/06/09

小民的沙龍

高一下，統計1

要觀察一個數值的集合有很多方法，透過這些方法得出數值集合的某些特徵，可以讓我們除了「感覺」外，能有更「理性客觀」的方式來理解這個數值集合的特徵。眾數：一個集合中出現最多次的那個元素，以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是，以眾數作為一個集合的標籤，我們無法透過眾數得知

2023/04/11

2023/04/11

檢查樣本數據是否符合常態分配，價格數據若是符合常態分配，則視為正常行情，反之則視為有突破訊號。常態分配檢定有數種方法，本文介紹的是w/s檢定，檢定統計量僅需計算樣本全距(w)，還有標準差(s)，然後求其比值，接者透過查表比較其上、下臨界值，查表值請參考下圖

2022/01/24

2022/01/24

Durbin-Watson test，對模組的殘差項進行相關聯性檢定，常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近，若有則可以判定盤整盤，反之則有趨勢發生，相關統計檢定計算步驟詳列如下

2022/01/18

2022/01/18

承續前篇內容，另外使用第二種隨機性檢定方式，來判斷價格是否處於盤整盤，假若為盤整盤，價格應集中在均線位置附近或是前後相鄰的數值差異很小，數據計算方法如下

2022/01/13

2022/01/13

價格數據可透過隨機性檢定方式，以判斷行情是否在盤整盤狀態。假若行情為盤整盤，前後價格應該偏向漲跌互見的形式；反之若為趨勢盤，則前後價格應該偏向漲、漲、漲與跌、跌、跌的連續形式。統計方法如下 : 假設有一系列的觀察值X(1)、X(2)、...、X(n)，系列相關係數與統計檢定量定義如下

2022/01/12

2022/01/12

假設你有一串時間數列資料，資料時間長度可以是Tick、分鐘K，也可以是日K的等級，請問有甚麼方法可以評估是否為盤整盤 ?

#交易策略

2022/01/11

Piemann的沙龍

統計檢定方法運用.1

假設你有一串時間數列資料，資料時間長度可以是Tick、分鐘K，也可以是日K的等級，請問有甚麼方法可以評估是否為盤整盤 ?

#交易策略

2022/01/11

中老年fc的指數化奇幻漂流

別讓統計數字騙了你（How to Lie wish Statistics)

別讓統計數字騙了你（How to Lie wish Statistics) 有內建偏差的樣本抽樣的樣本不足以代表全體，有代表性的樣本，這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果，樣本中會明顯少了總是開車出門的樣本。受訪者想要給一個會讓訪問員喜歡的答案，在

2021/10/09

中老年fc的指數化奇幻漂流

別讓統計數字騙了你（How to Lie wish Statistics)

2021/10/09

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News