統計急救箱─使用獨立t test的時機與前提

更新於 發佈於 閱讀時間約 7 分鐘

  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?


  而既然有獨立的t test,是不是就表示會有不獨立的t test呢?沒錯,下一篇文章也會簡單介紹一下所謂的相依資料是什麼。


使用獨立樣本t test的時機

  要了解使用獨立樣本t test的時機,需要先具備判斷變數類型的知識。不過這並不是什麼很難的東西,只要看過統計急救箱─變數與變數類型就能大概知道囉。

  那麼在什麼狀況下我們應該使用獨立樣本t檢定呢?就是

當獨變項 (independent variable, IV) 為兩組的類別變數,且依變數 (deendent variable, DV) 為連續變數時,可以使用t test。
獨立樣本t test的適用時機

獨立樣本t test的適用時機


好吧,我知道這句話聽起來不像是人說的話,下面我用個白話點的版本說。

  不過這裡要先補充一下,所謂的獨變數 (IV) 是指「被當作原因的變數」,也有人稱其為自變數、外生變數 [*1] 等。

  有因,就會有果(就像咖啡因來自於咖啡果)。所謂的依變數(DV)就是指「被當作結果的變數」,也可以說是「受到獨變數影響而改變的變數」,也有人翻譯叫做應變數。

  以上的說法是將t test放在因果關係的框架裡面思考,但其實統計學技術本身是不一定要預設因果關係的。所以可以用下面這個更白話點的方式來說明使用獨立樣本t test的時機:

當我們要了解兩群獨立數值母體平均數是否相等的時候。

在上方分別用粗體、斜體跟底線標記出了關鍵的判斷條件。以下簡單舉幾個可以使用t test回答的研究問題:

  • 男生與女生的外貌焦慮程度是否相等?
  • 付費會員與免費會員的平均年齡是否相等?
  • A作者和B作者在文章中使用特定詞彙的頻率是否相等?
  • 哈佛大學和耶魯大學應屆畢業生的平均薪資是否相等?

諸如此類的問題,都是先描述了有兩群人(男生女生、付費免費會員、不同作者、不同學校等),然後詢問這些人在某個特定數值(容貌焦慮程度、年齡、詞頻、薪資等)上是否相等。


使用獨立樣本t test的前提

  通常而言,社會科學領域的推論統計大部分都具有一些前提條件。這個前提條件的意思是,當資料不滿足某些條件時,使用這樣的分析技術可能得到不夠準確的結果 [*2]。獨立樣本t test也具有好幾個前提條件,以下分別列舉出來。

  1. 樣本中的個體是獨立且被隨機選取的。
      如果還記得如何從抽樣分布的中央極限定理,一路推展到Z分配和t分配做假設檢定,就會發現我們的舉例一直都是「從一個黑色大塑膠袋裡面隨機抽n顆球 (樣本) 出來」。這樣的做法事實上都假設每一顆球被抽到的機會是相等的。例如從10顆球當中隨機拿兩顆球出來,那每一顆球被選到的機率應該是1/5。
      但如果今天的規則變成:從10顆球當中先抽取1顆球,接著從袋子中移除所有與第1顆球顏色相同的球後,再隨機抽取一顆球。這樣會造成第2顆球被選到的機率受到第1顆球影響,也就是選第2顆球和選第1顆球之間是不獨立的事件。這樣一來,抽樣分布就很可能不會是一個常態的分布,那後面依賴常態分布的特性所做的推論就都派不上用場了
  2. 要檢驗的分數 (依變數) 是連續分數,且依照另一個變數 (獨變數) 分為兩群。
      這個其實就是上一個段落提到獨立樣本t test的適用時機,同時也是前提條件。
  3. 假設兩群樣本的母體服從常態分布。
      這個前提其實比較弔詭,因為我們並不會真的知道母體分布是什麼樣子的。實務上比較常見的做法是從樣本本身的分布去推測母體是否有較大的機會為常態?也就是說,如果樣本分布是接近常態的,那就比較容易相信母體也有可能是常態的分布 [*3]。
  4. 兩群樣本的母體變異數相同(稱為變異數同質性假定)
      獨立樣本t檢定是要檢驗兩群樣本的母體平均數是否相等,也就是說從樣本可以推理出兩個抽樣分布。這個假定也就是說,兩群樣本各自形成的抽樣分布是等寬的常態分布。
      那為什麼這很重要呢?在統計急救箱─獨立樣本t檢定裡面提到過獨立t test的原理是透過兩群分數相減後的差異分數進行推論,但如果兩個母體的變異數不相等,差異分數的抽樣分布就可能不會形成常態,因此也無法推論兩群母體的平均數是否相等了。
獨立樣本t test的重要前提假設

獨立樣本t test的重要前提假設

  1. 兩群母體是獨立的
      在「獨立樣本t test」當中,所謂的獨立樣本指的是第一群樣本和第二群樣本彼此獨立。也就是說,從第一個母體中抽出樣本這個行為,不會影響到第二群樣本被選中的機率。這聽起來相當抽象,也許看一些實際的例子會比較好理解。但這樣寫下去就有點太長了,所以關於樣本相依性的說明就留到下一篇再說囉。




2024年要過完了,得逼自己有點產出XD。



備註:

[*1]: 就我個人的意見來說,我並不認為將獨變數和外生變數 (exogenous variable,或叫做外衍變數) 畫上等號是正確的。確實外生變數必然是獨變數,但有時候內生變數 (endogenous variable,或稱為內衍變數) 也可以當作獨變數。


[*2]: 通常來說所謂的「不精確的結果」,具體會體現在Type I error rate (第一類錯誤率) 和Type II error rate (第二類錯誤率) 上面。前者指的是「獨變數沒有效果但統計上誤以為有效」的機率,後者則是「獨變數有效果但統計上誤以為無效」的機率。這個寫下去是另一個大主題了,在這裡就先略過吧。


[*3]: 事實上獨立樣本t test到底要不要求母體服從常態,學者之間的看法並不完全一致。有些學者指出這可能是很複雜的情況,不僅僅是常態或不常態的問題,可能還要考慮偏態是偏向哪邊、樣本大小、是否符合變異數同質性等因素 (Havlicek & Peterson, 1974)。就結論來說,當然是母體符合常態的狀況下最沒問題。只不過在現實中,要得到一筆常態的資料真的是沒那麼容易見到的......



參考文獻:

Havlicek, L. L., & Peterson, N. L. (1974). Robustness of the t test: A guide for researchers on effect of violations of assumptions. Psychological Reports, 34(3, Pt 2), 1095–1114. https://doi.org/10.2466/pr0.1974.34.3c.1095

留言
avatar-img
留言分享你的想法!
❦ 莊小昕-avatar-img
2024/12/29
您成功產出了! 👍👍👍
Way-avatar-img
發文者
2024/12/31
❦ 莊小昕 趕上了趕上了😂😂
avatar-img
統計急救箱的沙龍
67會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
2024/08/18
如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。 實務上來說,用Z檢定的機會其實比t檢定少。 這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。
Thumbnail
2024/08/18
如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。 實務上來說,用Z檢定的機會其實比t檢定少。 這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
本文探討自動化測試的核心理念與實際應用,涵蓋如何模擬運行環境、確保程式碼在各種情境下的穩定性,以及進行錯誤處理的方法。文中指出自動化測試的各種優點,並提到設計測試的注意事項。透過使用相關工具和方法,讀者可以有效進行功能測試,並掌握相關技巧以應對常見問題,讓開發過程更為順利。
Thumbnail
本文探討自動化測試的核心理念與實際應用,涵蓋如何模擬運行環境、確保程式碼在各種情境下的穩定性,以及進行錯誤處理的方法。文中指出自動化測試的各種優點,並提到設計測試的注意事項。透過使用相關工具和方法,讀者可以有效進行功能測試,並掌握相關技巧以應對常見問題,讓開發過程更為順利。
Thumbnail
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
實務中,我們很難決定要使用哪一種多層次模型更好,這時候可以透過模型比較方式給我們有用的建議。本文章將介紹如何透過R語言,使用ranova()和anova()來比較不同的多層次模型,並提供實際範例。
Thumbnail
實務中,我們很難決定要使用哪一種多層次模型更好,這時候可以透過模型比較方式給我們有用的建議。本文章將介紹如何透過R語言,使用ranova()和anova()來比較不同的多層次模型,並提供實際範例。
Thumbnail
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
Thumbnail
  推論統計應該是讓很多人苦惱過的主題,這篇文的目標就是回答「到底推論統計是什麼?」這個問題。
Thumbnail
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
Thumbnail
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News