統計急救箱─常態Z分數與Z檢定

更新於 2024/08/18閱讀時間約 9 分鐘

  終於要開始講統計檢定的實作部分了。

  其實我覺得之前我有點太急躁,先進入了t分數的概念介紹,現在又回來講Z分數的檢定操作順序不太對。為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。

  希望未來的人看到的時候,順序會比較正確一些。

  這篇前面還是帶到了前面幾篇講過的觀念,所以滿長的。已經了解前面概念的人,可以直接跳到「用實際數值做一次假設檢定」的段落開始看。



複習:假設檢定怎麼看?

  還記得之前解釋過假設檢定的基本邏輯,我們現在來複習一下:


首先,我們知道常態分布曲線從中心往左右延伸各一個標準差,這個區間的數值發生機率為68%。如果延伸兩個標準差,這個區間的數值發生機率就是95%。如果忘記所謂的「這個區間的數值」實際上指的是什麼(其實就是X軸的值),可以回頭到統計急救箱─常態分布與假設檢定(上)裡面看喔。

  所以現在我們應該知道怎麼解讀這兩張圖了:如果有一群資料的機率分布如同那個藍色面積的曲線(它正式的名字是──平均數為0且標準差為sigma的常態分布曲線),那麼我們得到觀察結果1的機率,應該介於68%到95%之間。

  上面的原則說是說了,但怎麼好像還是聽不太懂...例如說那個觀察樣本的值(在X軸上的位置)到底是怎麼算出來的?或者那個68%的區間到底具體上是指哪裡到哪裡?可能會有這樣的困惑。

  沒問題,我們就用實際的數值來看看吧!



用實際數值做一次假設檢定:找出臨界值 (CV)

  首先,我們一定會從一群數值開始。假設現在我手上有五個人的某種資料...例如他們對自己工作滿意度的評分好了。這五個人的分數可以算出一個平均數,就是下面那橘色的人形。

好久不見這些小人了,平均數為-1,看起來他們不太喜歡自己的工作...

好久不見這些小人了,平均數為-1,看起來他們不太喜歡自己的工作...


從這五個人身上得出一個平均分數,就如同之前介紹過抽球的例子一樣,像是從整體人群(一整袋球)之中抽出5個人(五顆球),並計算其平均分數。當我們重複做這件事情無數次之後,把每一次的結果畫成次數分配圖(或者機率圖),就會形成一個常態分配,我們稱之為抽樣分布。詳細的過程請見統計急救箱─抽樣分布與中央極限定理(二)

  在統計急救箱─抽樣分布與標準誤當中也有提到過,這種抽樣分布之所以很重要,原因就是:只要知道抽樣分布的平均數與標準差,我們就能計算觀察結果出現的機率。而根據假設檢定的概念,我們並不需要精確知道發生機率到底有多大,我們只要知道這個觀察結果發生的機率是不是很小,就能有比較充足的信心說:母體的平均是否和目前的觀測結果不同。詳細的邏輯推論過程,請見統計急救箱─常態分布與假設檢定(下)

抽樣分布的平均數與標準差至關重要

抽樣分布的平均數與標準差至關重要


  而我們又已經知道當我們觀察得到的數值,也就是上面算出來工作滿意度的平均數,和「假設的」母體平均數之間有超過2個標準差的時候 (其實2個標準差只是近似值,後面會解釋),表示若假設為真,這個觀測出現的機率極小,因此假設的母體平均數不正確的機率較高,稱之為拒絕虛無假設

  那當我們知道母體平均數是多少,也知道抽樣分布的標準差是多少的時候,這個問題就簡單得很了。我們來看看下圖,這是一個母體平均為0.5,抽樣分布標準差為0.25的常態曲線:

綠色線段所在的X軸位置,就是68%的臨界值

綠色線段所在的X軸位置,就是68%的臨界值


黃色線段則是95%的臨界值

黃色線段則是95%的臨界值

可以非常簡單就算出,68%機率的區間應該是介於X軸上0.25~0.75的範圍之間,而95%機率則是介於0~1之間。這個區間的上下限,也就是上圖黃色虛線下方標記出的X軸數值,就是所謂的臨界值 (critical value, CV)。當超出這個臨界值的時候,我們就會知道如果虛無假設為真(也就是若母體平均為0.5),則觀察到目前結果的機率非常小(低於5%),因此推測母體平均不為0.5(拒絕虛無假設)。

  如果覺得上面的這一串真的太拐彎抹角了,需要一個超級懶人包,那我只好整理出來(雖然不推薦用這種過於簡化的方式記憶):

超出95%臨界值 → 獲得顯著的結果 → 拒絕虛無假設

所以最開始那五個人,他們的工作滿意度平均數就顯著的小於0.5。假如他們都是同一個公司的員工,那我們就可以推論這間公司的員工,工作滿意度分數可能是低於0.5分的 [*1]。



每次臨界值都要重算嗎?使用常態Z分數就不煩惱

  就像上面演示的一樣,一旦知道母體平均數和抽樣分布的標準差,那找出臨界值就是輕而易舉。只要把母體平均數加、減兩倍的標準差,就可以得到95%機率的臨界值啦~

  不過呢,這樣面臨到了一個麻煩 [*2],那就是只要母體平均數和抽樣分布標準差不同(例如數學考試和英文考試有各自不同的母體平均和標準差),不就每次臨界值都要重算?超級無敵麻煩的啦!

  不過...要解決「不同分數之間標準差和平均數不一致」這個困擾,好像在很~~~久之前曾經講過類似的事情。那就是把所有分數通通都轉換成「標準分數」就可以啦 (統計急救箱──標準分數),只不過公式長得跟之前有點不同:

抽樣分布的Z分數公式

抽樣分布的Z分數公式


  不過這個公式實際上怎麼用來解決剛剛的問題呢?我們先來理解概念,然後代換成剛剛例子中的實際數值就會比較好理解了。


符號解析

  先來看看右邊的符號們。要記得,上面用來做虛無假設檢定的分布是抽樣分布,所以公式中的x bar (就是x上面有一個槓槓的符號) 就是這次觀測所得到的平均數(也就是五個人的工作滿意度平均數:-1)。

   mu則是母體平均數,這個應該不陌生了吧

  分母的SDx bar則是指「抽樣分布的標準差」,如果想知道這符號到底是怎麼寫成這怪樣子的,我放在文末補充的地方。

  而公式左邊,則表示這是「x平均數的Z分數」。這是當然的,因為我們就是要把平均數轉換成Z分數嘛。


實際計算

  知道每個符號都代表什麼意思後,我們來實際代入數字可能就會讓一切更清楚了。在剛剛的例子裡面,這次的五人工作滿意度平均分數為-1,從上面圖中可以看到母體平均數為0.5,抽樣分布標準差為0.25。

  那麼!這次這五人的工作滿意度平均數,其Z分數為多少呢?答案就是 (-1 - 0.5) / 0.25,最後結果是 -6 喔~


轉換成Z分數的目的

  還記得我們為什麼要把平均數轉成Z分數嗎?因為我們不想要每次母體平均數和抽樣分布標準差一改變,就要重新計算一次臨界值嘛。

  而Z分數可以解決這個困擾。事實上,這個Z分數有個比較特別的名字,它叫做「常態化Z分數」,特別加上一個常態化就是要強調這是由一個常態分布(也就是抽樣分布)轉換成的Z分數 [*3]。

  那麼常態化Z分數的95%臨界值究竟是多少?答案是正負1.96 [*4]。也就是下圖中那個95%的紅色箭頭,其真正涵蓋的X軸範圍是-1.96 ~ +1.96這個區間。看起來指到2的位置只是因為1.96和2太接近了,圖上面看不出來。

95%的範圍不是-2到+2喔!

95%的範圍不是-2到+2喔!


同樣的,一個非常簡化的懶人包會這樣說:

如果確定這個Z分數是常態的,只要觀測到的Z分數值超過1.96或小於-1.96,就可以拒絕虛無假設

  上面這個過程,也就是所謂的Z檢定囉!


檢定結果

  那麼,上面那五個人的工作滿意度平均分數 (-1),在Z檢定裡面有沒有顯著的小於0.5呢?

  因為我們剛剛算出來,他們工作滿意度的平均分數轉換為Z分數是-6。那-6有沒有小於-1.96?不只有,而且還差很多。這時候我們就會在統計報告裡面寫下面這段話:

Z檢定結果顯示工作滿意度分數顯著小於0.5,Z = -6.0, p < .05。

怎麼突然冒出那個p < .05啊?其實這個翻成中文的意思就是「機率 (p) 小於5% (0.05)」的意思。這5%怎麼來的呢?如果不知道的話可以參考統計急救箱─常態分布與假設檢定(下)的說明喔。




  手上的專案應該快要上軌道了,希望能夠增加更新的頻率。




註解

[*1]: 其實不能這樣推論,因為五個人樣本實在太少了。這裡只是演示一下整個實作過程。

[*2]: 如果好奇為什麼「不知道母體平均和抽樣分布標準差是多少」不算是個麻煩,那只是因為這是下一篇的主題,而我不想在這裡破梗。

[*3]: 既然有常態化Z分數,就表示有非常態化的Z分數嗎?沒錯。事實上Z分數不會改變分布的長相,所以所謂的常態Z分數,就表示原本的分布就是常態的。那麼當然如果原本的分布不是常態的,轉成Z分數也不會是常態的囉~

[*4]: 正負1.96是常態Z分數的雙尾檢定95%臨界值 (如果比較不精準一點,就會進位變成2,這也是為什麼前面會用2來示範計算臨界值的原因),雙尾檢定是社會科學裡面比較常用到的檢定。而至於單尾檢定,這個急救箱暫時沒有打算解釋那是什麼,但網路上應該有非常多資料可以參考。


補充

  為什麼那個公式分母的SD旁邊的小足標要用x bar而不是x呢?這是因為「抽樣分布是由無數個x bar所組成的分布」。也就是說,組成抽樣分布的最小單位是x bar而不是x,所以要計算這個分布的標準差的時候,在足標加上x bar就是告訴讀者說:嘿!這個標準差是從x bar組成的分布得到的,而不是從x組成的分布所得到的喔!

  如果上面這段看不懂也沒關係,因為這是比較抽象的解釋。繼續接觸統計的話,有天就會像是頓悟一般的懂了,至少我以前是這樣的。


致謝

本文所用圖片當中的素材來自於https://www.flaticon.com,由juicy_fish創作。




avatar-img
51會員
31內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
統計急救箱的沙龍 的其他內容
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
在上一篇文章中區分了什麼是母體分布、樣本分布以及抽樣分布,另外也示範了抽樣分布的形成過程。在這一篇當中就要介紹抽樣分布與常態分佈之間到底是什麼樣的關係了。
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
在上一篇文章中區分了什麼是母體分布、樣本分布以及抽樣分布,另外也示範了抽樣分布的形成過程。在這一篇當中就要介紹抽樣分布與常態分佈之間到底是什麼樣的關係了。
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
筆者參與學校工作坊圖示 近期筆者在進行資料蒐集,逐漸地將過去紙本填答轉變為線上填答,在過去碩士期間時,我是用的是Mysurvey,不過後來多以Google表單進行設計,所以在此介紹過去筆者在設計問卷時的一些注意事項,在我們使用Google表單時,我們要先進入我們Google帳號的雲端,首先我們
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
統計學是一門強大的學科,它幫助我們理解和解釋數據,並作出合理的決策。無論你是在職場上需要處理數據,還是在個人生活中想更好地理解統計報告和研究,統計學基礎都是一個重要的知識領域。在這篇文章中,我們將探討統計學的基本概念,幫助你開始解密數據的語言。 1. 什麼是統計學? 統計學是一門研究如何收集、分
Thumbnail
現在的社會,每天在各方面都有太多統計資料,包括政治、經濟、娛樂等等。民眾竟然只會計算數學(也只是數論的部分),沒有統計概念,這實在不利於未來的生活。 統計學對未來社會生活真的很重要。雖然困難,應該在中學畢業前,國民教育課程要教導統計學基本概念。
Thumbnail
作為【統計微學堂】第一篇文章,本文不直接開門見山談論統計概念及方法介紹,而是回應SPSS初學者經常面臨到首要問題「如何安裝SPSS軟體」,是直接購買正版嗎?或洽由統計公司以租代買方式?還是透過網路下載逕行使用?又或是使用學長姐所傳承版本?
Thumbnail
覺得閱讀事一件蠻孤單的事情,看劇、聽音樂甚至出遊都可以與他人共享,而閱讀先不說難以與他人同步進行,每個人有感觸的部分都需要經過內化,比較難像戲劇那般被普遍的討論。所以讀墨這種以創作活絡的閱讀社群來鼓勵大家閱,同時利用類似等級打怪與收集限量徽章的遊戲方式增加使用者的參與意願都讓我感受出他們經營的用心。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
筆者參與學校工作坊圖示 近期筆者在進行資料蒐集,逐漸地將過去紙本填答轉變為線上填答,在過去碩士期間時,我是用的是Mysurvey,不過後來多以Google表單進行設計,所以在此介紹過去筆者在設計問卷時的一些注意事項,在我們使用Google表單時,我們要先進入我們Google帳號的雲端,首先我們
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
統計學是一門強大的學科,它幫助我們理解和解釋數據,並作出合理的決策。無論你是在職場上需要處理數據,還是在個人生活中想更好地理解統計報告和研究,統計學基礎都是一個重要的知識領域。在這篇文章中,我們將探討統計學的基本概念,幫助你開始解密數據的語言。 1. 什麼是統計學? 統計學是一門研究如何收集、分
Thumbnail
現在的社會,每天在各方面都有太多統計資料,包括政治、經濟、娛樂等等。民眾竟然只會計算數學(也只是數論的部分),沒有統計概念,這實在不利於未來的生活。 統計學對未來社會生活真的很重要。雖然困難,應該在中學畢業前,國民教育課程要教導統計學基本概念。
Thumbnail
作為【統計微學堂】第一篇文章,本文不直接開門見山談論統計概念及方法介紹,而是回應SPSS初學者經常面臨到首要問題「如何安裝SPSS軟體」,是直接購買正版嗎?或洽由統計公司以租代買方式?還是透過網路下載逕行使用?又或是使用學長姐所傳承版本?
Thumbnail
覺得閱讀事一件蠻孤單的事情,看劇、聽音樂甚至出遊都可以與他人共享,而閱讀先不說難以與他人同步進行,每個人有感觸的部分都需要經過內化,比較難像戲劇那般被普遍的討論。所以讀墨這種以創作活絡的閱讀社群來鼓勵大家閱,同時利用類似等級打怪與收集限量徽章的遊戲方式增加使用者的參與意願都讓我感受出他們經營的用心。