為什麼要有ANOVA?
學到現在,我們知道在處理名義變項上,我們使用卡方檢定;而在等距及比率變項上,我們使用z檢定與t檢定。卡方可以處理三個變項,那z檢定與t檢定呢?答案是可以,但不推薦。
ANOVA也可以使用在2個變項,這時F=t2。
為什麼3組變項時,不推薦z檢定與t檢定?
這兩個檢定方法都是要兩兩比較的,因此如果今天有5組的話,我們總共要做10次的檢驗(C5取2)!這是一件很麻煩的事情。但也許你特別熱愛這兩個統計方法,要做100次你也願意,這樣還不行嗎?
答案是可以的!但需要改變我們原先要的顯著水準。為什麼要改顯著水準?
還記得TYPE I ERROR嗎?當我們推翻H0,我們還是有0.05的機率判斷失誤。每做一次檢定,我們做正確判斷的機率就會越來越小。例:做一次檢定,有95%的機率正確;做兩次檢定,有90%的機率正確;...;做十次檢定,有60%的機率正確。當我們檢驗越多次,α判斷失誤的機率會越來越高,這個現象我們稱之為Family-wise error rate(FWER)。
因此,我們一開始的α不能設定0.05,需要透過下面的方式改善。
等距、比率變項遇到三組以上的話怎麼辦?
我們就推薦使用ANOVA!使用ANOVA我們可以知道是否有組別特別顯著,只透過一次的統計方式,就可以看出整體的差異。如果顯著發現有不一樣的時候,我們可以再使用事後比較找出顯著有差異的組別。
補充:t檢定與ANOVA的差異
例如,我們想要知道XX國一的資優班是不是特別優異。這時我們用A、B、C、D、放牛班這五個班級來做比較。
如果用t檢定,我們用資優班跟放牛班來比沒有什麼太大的意義。差距是很大沒錯,但是無法看出「特別優異」的結論,需要跟其他4個班級都比過之後,才有可能得出。但在重複檢驗的情況下,會導致失誤的機率很高。
因此,我們會利用ANOVA僅做一次,了解是否在整體上有顯著差異,若有再做事後比較。
ANOVA 基本概念
使用前提:變異數同質性(等分散性)、常態性
若實驗成功,組間變異數 > 組內變異數,要大到什麼程度取決於F分配。若沒有顯著,代表組間的效果可能是抽樣的誤差造成的,並沒有特別的不一樣。

左圖組間效果不明顯,右圖明顯
SS、MS、df:畫出一張ANOVA表

ANOVA 表
F分配:取決於兩個自由度

d1=dfB、d2=dfW
從樣本誤差變異數推估母群誤差變異數
前提:σ12=σ22=σ32=σ42=σ52=σe2

t test pooled variance = ANOVA MSw
效果量
d family:Cohen's d

r family:Eta-Squared、Partial Eta-Squared、Omega-Squared

事前比較
t檢定比較會導致FWER,因此使用 Bonferroni inequality公式得到新的α'。
α'=α/c,c是要檢定的組數
Bonferreni t

事後比較
嚴謹度:LSD procedure < Tukey's Test < Scheffe Test
LSD procedure
直接用t檢定,沒有控制FWER
Tukey's Test
使用較嚴格的 Studentized range statistic (q),找到HSD再快速比較

Scheffe Test
不只兩組比較,是一個複雜比較









