統計急救箱─單樣本t檢定

閱讀時間約 7 分鐘

如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。

實務上來說,用Z檢定的機會其實比t檢定少,這是因為t分數只需要使用樣本標準差就能算出來,而Z分數卻需要仰賴一個我們根本不知道多少的母體標準差。

這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。


本篇文章所介紹的t分數,全名為Student't score (有人翻譯為司徒頓t檢定)。一般在社會科學研究當中,沒有特別舉出全名的話,t分數通常就是指Student't score。

之所以會強調這一點,是因為除了經典的Student't test之外,也有其他的t-test存在。



t分數跟Z分數很類似

  首先我們需要介紹一下t分數是什麼東西。

  在先前的文章 (統計急救箱─抽樣分布與標準誤) 當中,提到過抽樣分布會長成什麼樣子,是由兩個數值決定的:第一個是母體平均數(決定位置),第二個是母體標準差(決定寬度)。

  但因為我們不會知道母體標準差是多少,所以就只好用已知的樣本標準差 (就是這次收資料算出來的標準差) 來代替,形成抽樣分布的標準誤 (SE)。這樣一來,我們就可以做像是Z檢定一樣的統計檢定囉~

  這個檢定的名字,就叫做t檢定。也就是說,把Z檢定裡的抽樣分布標準差 (standard deviation of sampling distribution),改成抽樣分布標準誤 (standard error of sampling distribution),就會從Z檢定變成t檢定了


t檢定的原理跟Z檢定是相同的,只是用的是標準誤而不是標準差

t檢定的原理跟Z檢定是相同的,只是用的是標準誤而不是標準差


t分數和Z分數的關鍵差異:自由度

  但這時候可能會有個疑惑...就這麼簡單?直接把母體標準差換成樣本標準差真的不會有什麼問題嗎?

  嗯...原理上來說其實真的就這麼簡單沒錯。但當然把母體標準差直接換成樣本標準差,還是會有點不一樣的。那就是...這樣計算出來的抽樣分布不會是個常態分布,而變成一種叫做t分布的分布

  哇,那這下問題不就大了?前面說的假設檢定都建立在抽樣分布形成的常態分布上,結果現在t檢定卻建立在一個不是常態的分布上,那我們怎麼算機率做檢定?  

  

  沒關係,我們先來看看t分布到底長成什麼樣子再說。

  t分布雖然不是一個常態分布,但其實長得也滿像常態的。更重要的是,t分布的形狀會隨著我們抽樣的樣本大小而改變

  這是什麼意思呢?我們用下面的圖來比較一下。假設下面描繪的都是所謂的「抽樣分布 (sampling distribution)」(想了解抽樣分布是什麼,可以參考統計急救箱─抽樣分布與中央極限定理(一))。

  黑色的線就是標準常態分布 (平均數為0,標準差為1的常態分布),紅色的線段是樣本數很小的時候算出的t分布,藍色的線段樣本數比紅色的多,綠色的線段樣本數又比藍色更多。也就是說,黑色的線就是我們拿來做Z檢定的常態分布曲線,而紅色、藍色、綠色的線則是我們把Z分數改成t分數後得出來的分布曲線(只不過這三條線代表的抽樣樣本數是不一樣的)。

  在這裡我們會發現一件事:樣本數越大的時候,t分數的線會越來越靠近常態分布 (綠色的線很接近黑色的線)。

不同自由度下的t分布

不同自由度下的t分布


  有趣的是,當樣本數大到某個程度以後,t分布的線段幾乎就不會再隨著樣本數增加而改變了。這個時候的t分布,長得跟常態分布已經幾乎是一模一樣。

  下圖中我們又再次畫了不同樣本數所得出的抽樣分布曲線。可以發現幾乎分不出這些t分布的線段 (綠色、藍色、紅色) 和常態分布曲線的差異了。

自由度夠大的t分數跟常態分布差不多了

自由度夠大的t分數跟常態分布差不多了


到了這個時候,使用樣本標準差而不是母體標準差來計算抽樣分布的標準誤,感覺就沒什麼大問題了吧?因為當樣本數大到某個地步之後,所得到的t分數分布跟常態分布幾乎沒有差,那接下來的事情也就跟Z檢定差不多了。至於這個樣本數到底多大才行?普遍常用的標準是超過30就可以了 (Field, 2017)。


  雖然上面都是說隨著抽樣的樣本數變大 (想像成從袋子中抽出的球數目越多),t分布會越加趨近於常態。不過在統計上不會說樣本數,而是有一個特殊的名詞叫做「自由度 (degree of freedom, df)」來表達t分布樣貌的改變(所以可以看到上面的圖,右上角寫的都是df而不是N,代表這是說自由度的意思)。

  為什麼要這麼麻煩,弄一個新名詞出來?這是因為自由度才是真正決定t分布樣子的參數,只不過這個自由度跟樣本數有關,所以上面為了解釋上的方便才會先用樣本數代替。在不同的情況下,自由度跟樣本數之間的關係會有變化,所以使用樣本數來表達t分布的樣貌不如使用自由度來的精確。也因為這個原因,在報告t檢定結果時一定會一起報告自由度的

  雖然我會建議還是要知道自由度怎麼算比較好,但對於初學者來說也不用太執著這個問題,可以先看統計軟體給你的數字就行了。



單樣本t檢定的運作原理(跟Z檢定是一樣的)

  上面花了大量篇幅指出t分布和Z分布的相似與相異處。不過如果要給個不精確的超級懶人包的話:

在樣本數夠大的時候t分布可以直接被當成Z分布,也因此可以當成抽樣分布來看待。

所以在實務上,t檢定的原理幾乎就跟Z檢定一樣了,這裡就只快速講一下基本邏輯。


  首先,依循Z檢定的邏輯,我們要透過抽樣分布 (sampling distribution) 來做假設檢驗──「若母體平均數為mu,我們現在觀察到的樣本平均數有多大的機率會發生?」假如機率很小 (小於5%機會),我們就可以傾向說母體平均數可能不是mu。

又是這張圖,只不過這次我們要用t分布來當作抽樣分布了 [*1]

又是這張圖,只不過這次我們要用t分布來當作抽樣分布了 [*1]


  在統計急救箱─常態Z分數與Z檢定中,我們以平均數為中心,分別加上或減去一個標準差找出兩個臨界值,畫出了95%的區間。如果觀察值落於這個區間之外,就代表當母體平均數為mu時,看到當前結果的機率小於5%,所以我們拒絕虛無假設 (也就是認為母體平均比較有可能不是mu)。而在t檢定中,我們用同樣的方法找出臨界值,只是把標準差換成標準誤而已。

在Z檢定中我們找臨界值是使用抽樣分布的標準差,而在t檢定中則是用標準誤

在Z檢定中我們找臨界值是使用抽樣分布的標準差,而在t檢定中則是用標準誤


  現在有了臨界值後,唯一剩下需要知道的就是這次抽樣平均數落在這個分布圖上面的哪個點了。計算方法跟Z分數差不多,只是把抽樣分布的標準差改成標準誤就行了。

計算本次抽樣平均數在抽樣分布中的t分數

計算本次抽樣平均數在抽樣分布中的t分數


以上就是t分數和t檢定的基本運作方式囉~

t分數在實務上很好用的,熟悉原理對於後續進階的統計檢定會很有幫助喔。




前一篇說專案快上軌道了,結果...

總之人果然不能亂說話,再不更新我自己都以為要棄坑了。

現在學會單樣本的t檢定了,下一篇就來講講一個常見的應用──相關係數的顯著性檢定吧。

去年開始這個寫作計畫的時候,原本預計一年後至少寫到ANOVA的啊...orz




備註:

[*1] 雖然我之前都說這個常態分布圖的縱軸是機率,但其實並不完全正確。如果仔細瞧瞧縱軸會發現這個常態分布曲線的頂點超過1,但難道有機率可以大於1的嗎?嗯...並不是這樣的。這種圖形在統計上叫做機率密度函數圖 (probability density function, pdf),它的縱軸是有可能大於1沒錯,但把縱軸當成機率來看在某種意義上也沒錯。總之...如果真的想知道的話,要先學會積分才可以,所以這裡就不多說了。不過統計急救箱─常態分布與機率的最後其實有稍微提到一些相關概念。


參考文獻

其實講出建議t檢定樣本數建議超過30的教科書到處都是,這裡只是舉出其中一本而已。

Field, A. (2017). Discovering statistics using IBM SPSS statistics (5th ed.). Sage.


致謝

本文所用圖片當中的素材來自於https://www.flaticon.com,由juicy_fish創作。


49會員
30內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
留言0
查看全部
發表第一個留言支持創作者!
統計急救箱的沙龍 的其他內容
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
在上一篇文章中區分了什麼是母體分布、樣本分布以及抽樣分布,另外也示範了抽樣分布的形成過程。在這一篇當中就要介紹抽樣分布與常態分佈之間到底是什麼樣的關係了。
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
在上一篇文章中區分了什麼是母體分布、樣本分布以及抽樣分布,另外也示範了抽樣分布的形成過程。在這一篇當中就要介紹抽樣分布與常態分佈之間到底是什麼樣的關係了。
  這幾天因為選舉民調的關係,統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞,例如抽樣、區間、抽樣誤差等等。   其實這些通通都是推論統計的觀念,網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼,應該不需要我野人獻曝了。   不過如果真的想要了
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
筆者參與學校工作坊圖示 近期筆者在進行資料蒐集,逐漸地將過去紙本填答轉變為線上填答,在過去碩士期間時,我是用的是Mysurvey,不過後來多以Google表單進行設計,所以在此介紹過去筆者在設計問卷時的一些注意事項,在我們使用Google表單時,我們要先進入我們Google帳號的雲端,首先我們
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
統計學是一門強大的學科,它幫助我們理解和解釋數據,並作出合理的決策。無論你是在職場上需要處理數據,還是在個人生活中想更好地理解統計報告和研究,統計學基礎都是一個重要的知識領域。在這篇文章中,我們將探討統計學的基本概念,幫助你開始解密數據的語言。 1. 什麼是統計學? 統計學是一門研究如何收集、分
Thumbnail
現在的社會,每天在各方面都有太多統計資料,包括政治、經濟、娛樂等等。民眾竟然只會計算數學(也只是數論的部分),沒有統計概念,這實在不利於未來的生活。 統計學對未來社會生活真的很重要。雖然困難,應該在中學畢業前,國民教育課程要教導統計學基本概念。
Thumbnail
作為【統計微學堂】第一篇文章,本文不直接開門見山談論統計概念及方法介紹,而是回應SPSS初學者經常面臨到首要問題「如何安裝SPSS軟體」,是直接購買正版嗎?或洽由統計公司以租代買方式?還是透過網路下載逕行使用?又或是使用學長姐所傳承版本?
Thumbnail
覺得閱讀事一件蠻孤單的事情,看劇、聽音樂甚至出遊都可以與他人共享,而閱讀先不說難以與他人同步進行,每個人有感觸的部分都需要經過內化,比較難像戲劇那般被普遍的討論。所以讀墨這種以創作活絡的閱讀社群來鼓勵大家閱,同時利用類似等級打怪與收集限量徽章的遊戲方式增加使用者的參與意願都讓我感受出他們經營的用心。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
筆者參與學校工作坊圖示 近期筆者在進行資料蒐集,逐漸地將過去紙本填答轉變為線上填答,在過去碩士期間時,我是用的是Mysurvey,不過後來多以Google表單進行設計,所以在此介紹過去筆者在設計問卷時的一些注意事項,在我們使用Google表單時,我們要先進入我們Google帳號的雲端,首先我們
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
統計學是一門強大的學科,它幫助我們理解和解釋數據,並作出合理的決策。無論你是在職場上需要處理數據,還是在個人生活中想更好地理解統計報告和研究,統計學基礎都是一個重要的知識領域。在這篇文章中,我們將探討統計學的基本概念,幫助你開始解密數據的語言。 1. 什麼是統計學? 統計學是一門研究如何收集、分
Thumbnail
現在的社會,每天在各方面都有太多統計資料,包括政治、經濟、娛樂等等。民眾竟然只會計算數學(也只是數論的部分),沒有統計概念,這實在不利於未來的生活。 統計學對未來社會生活真的很重要。雖然困難,應該在中學畢業前,國民教育課程要教導統計學基本概念。
Thumbnail
作為【統計微學堂】第一篇文章,本文不直接開門見山談論統計概念及方法介紹,而是回應SPSS初學者經常面臨到首要問題「如何安裝SPSS軟體」,是直接購買正版嗎?或洽由統計公司以租代買方式?還是透過網路下載逕行使用?又或是使用學長姐所傳承版本?
Thumbnail
覺得閱讀事一件蠻孤單的事情,看劇、聽音樂甚至出遊都可以與他人共享,而閱讀先不說難以與他人同步進行,每個人有感觸的部分都需要經過內化,比較難像戲劇那般被普遍的討論。所以讀墨這種以創作活絡的閱讀社群來鼓勵大家閱,同時利用類似等級打怪與收集限量徽章的遊戲方式增加使用者的參與意願都讓我感受出他們經營的用心。