統計急救箱─使用獨立t test的時機與前提

閱讀時間約 7 分鐘

  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?


  而既然有獨立的t test,是不是就表示會有不獨立的t test呢?沒錯,下一篇文章也會簡單介紹一下所謂的相依資料是什麼。


使用獨立樣本t test的時機

  要了解使用獨立樣本t test的時機,需要先具備判斷變數類型的知識。不過這並不是什麼很難的東西,只要看過統計急救箱─變數與變數類型就能大概知道囉。

  那麼在什麼狀況下我們應該使用獨立樣本t檢定呢?就是

當獨變項 (independent variable, IV) 為兩組的類別變數,且依變數 (deendent variable, DV) 為連續變數時,可以使用t test。
獨立樣本t test的適用時機

獨立樣本t test的適用時機


好吧,我知道這句話聽起來不像是人說的話,下面我用個白話點的版本說。

  不過這裡要先補充一下,所謂的獨變數 (IV) 是指「被當作原因的變數」,也有人稱其為自變數、外生變數 [*1] 等。

  有因,就會有果(就像咖啡因來自於咖啡果)。所謂的依變數(DV)就是指「被當作結果的變數」,也可以說是「受到獨變數影響而改變的變數」,也有人翻譯叫做應變數。

  以上的說法是將t test放在因果關係的框架裡面思考,但其實統計學技術本身是不一定要預設因果關係的。所以可以用下面這個更白話點的方式來說明使用獨立樣本t test的時機:

當我們要了解兩群獨立數值母體平均數是否相等的時候。

在上方分別用粗體、斜體跟底線標記出了關鍵的判斷條件。以下簡單舉幾個可以使用t test回答的研究問題:

  • 男生與女生的外貌焦慮程度是否相等?
  • 付費會員與免費會員的平均年齡是否相等?
  • A作者和B作者在文章中使用特定詞彙的頻率是否相等?
  • 哈佛大學和耶魯大學應屆畢業生的平均薪資是否相等?

諸如此類的問題,都是先描述了有兩群人(男生女生、付費免費會員、不同作者、不同學校等),然後詢問這些人在某個特定數值(容貌焦慮程度、年齡、詞頻、薪資等)上是否相等。


使用獨立樣本t test的前提

  通常而言,社會科學領域的推論統計大部分都具有一些前提條件。這個前提條件的意思是,當資料不滿足某些條件時,使用這樣的分析技術可能得到不夠準確的結果 [*2]。獨立樣本t test也具有好幾個前提條件,以下分別列舉出來。

  1. 樣本中的個體是獨立且被隨機選取的。
      如果還記得如何從抽樣分布的中央極限定理,一路推展到Z分配和t分配做假設檢定,就會發現我們的舉例一直都是「從一個黑色大塑膠袋裡面隨機抽n顆球 (樣本) 出來」。這樣的做法事實上都假設每一顆球被抽到的機會是相等的。例如從10顆球當中隨機拿兩顆球出來,那每一顆球被選到的機率應該是1/5。
      但如果今天的規則變成:從10顆球當中先抽取1顆球,接著從袋子中移除所有與第1顆球顏色相同的球後,再隨機抽取一顆球。這樣會造成第2顆球被選到的機率受到第1顆球影響,也就是選第2顆球和選第1顆球之間是不獨立的事件。這樣一來,抽樣分布就很可能不會是一個常態的分布,那後面依賴常態分布的特性所做的推論就都派不上用場了
  2. 要檢驗的分數 (依變數) 是連續分數,且依照另一個變數 (獨變數) 分為兩群。
      這個其實就是上一個段落提到獨立樣本t test的適用時機,同時也是前提條件。
  3. 假設兩群樣本的母體服從常態分布。
      這個前提其實比較弔詭,因為我們並不會真的知道母體分布是什麼樣子的。實務上比較常見的做法是從樣本本身的分布去推測母體是否有較大的機會為常態?也就是說,如果樣本分布是接近常態的,那就比較容易相信母體也有可能是常態的分布 [*3]。
  4. 兩群樣本的母體變異數相同(稱為變異數同質性假定)
      獨立樣本t檢定是要檢驗兩群樣本的母體平均數是否相等,也就是說從樣本可以推理出兩個抽樣分布。這個假定也就是說,兩群樣本各自形成的抽樣分布是等寬的常態分布。
      那為什麼這很重要呢?在統計急救箱─獨立樣本t檢定裡面提到過獨立t test的原理是透過兩群分數相減後的差異分數進行推論,但如果兩個母體的變異數不相等,差異分數的抽樣分布就可能不會形成常態,因此也無法推論兩群母體的平均數是否相等了。
獨立樣本t test的重要前提假設

獨立樣本t test的重要前提假設

  1. 兩群母體是獨立的
      在「獨立樣本t test」當中,所謂的獨立樣本指的是第一群樣本和第二群樣本彼此獨立。也就是說,從第一個母體中抽出樣本這個行為,不會影響到第二群樣本被選中的機率。這聽起來相當抽象,也許看一些實際的例子會比較好理解。但這樣寫下去就有點太長了,所以關於樣本相依性的說明就留到下一篇再說囉。




2024年要過完了,得逼自己有點產出XD。



備註:

[*1]: 就我個人的意見來說,我並不認為將獨變數和外生變數 (exogenous variable,或叫做外衍變數) 畫上等號是正確的。確實外生變數必然是獨變數,但有時候內生變數 (endogenous variable,或稱為內衍變數) 也可以當作獨變數。


[*2]: 通常來說所謂的「不精確的結果」,具體會體現在Type I error rate (第一類錯誤率) 和Type II error rate (第二類錯誤率) 上面。前者指的是「獨變數沒有效果但統計上誤以為有效」的機率,後者則是「獨變數有效果但統計上誤以為無效」的機率。這個寫下去是另一個大主題了,在這裡就先略過吧。


[*3]: 事實上獨立樣本t test到底要不要求母體服從常態,學者之間的看法並不完全一致。有些學者指出這可能是很複雜的情況,不僅僅是常態或不常態的問題,可能還要考慮偏態是偏向哪邊、樣本大小、是否符合變異數同質性等因素 (Havlicek & Peterson, 1974)。就結論來說,當然是母體符合常態的狀況下最沒問題。只不過在現實中,要得到一筆常態的資料真的是沒那麼容易見到的......



參考文獻:

Havlicek, L. L., & Peterson, N. L. (1974). Robustness of the t test: A guide for researchers on effect of violations of assumptions. Psychological Reports, 34(3, Pt 2), 1095–1114. https://doi.org/10.2466/pr0.1974.34.3c.1095

avatar-img
52會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
統計急救箱的沙龍 的其他內容
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。 實務上來說,用Z檢定的機會其實比t檢定少。 這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。 實務上來說,用Z檢定的機會其實比t檢定少。 這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
你可能也想看
Google News 追蹤
1. 使用GReaT框架進行條件生成: - Vadim Borisov在2023年發表的文章《Language Models are Realistic Tabular Data Generators》中提出了GReaT框架。GReaT代表Generation of Realistic Tabul
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
瞭解如何透過Regression實作Classification,使用one-hot vector表示不同的類別,並透過乘上不同的Weight和加上不同的bias來得到三個數值形成向量。同時通過softmax的方式得到最終的y'值,並探討使用Cross-entropy來計算類別的loss。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
1. 使用GReaT框架進行條件生成: - Vadim Borisov在2023年發表的文章《Language Models are Realistic Tabular Data Generators》中提出了GReaT框架。GReaT代表Generation of Realistic Tabul
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
瞭解如何透過Regression實作Classification,使用one-hot vector表示不同的類別,並透過乘上不同的Weight和加上不同的bias來得到三個數值形成向量。同時通過softmax的方式得到最終的y'值,並探討使用Cross-entropy來計算類別的loss。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。