z檢定使用時機:已知母群標準差、若母群為非常態,需要抽取樣本數N>30。
(備註:常態分配時,才能夠使用。也是唯一能使用CLT的檢定方式)
區間估計:從x̄ 猜測μ範圍
連續變項
設x̄ 是一個N(61,1)的常態分配,信賴水準95%的情況下,μ的信賴區間為?
先確認是否可以使用z檢定:常態分配、已知抽樣分配標準誤為1。可以!
信賴水準95%是在x̄ ±1.96σx̄ 的範圍內,因此x̄ -1.96σx̄ < μ < x̄ +1.96σx̄,帶入數值(x̄ =61、σx̄ = 1),59.04 < μ < 62.96。
信賴區間為[59.04 , 62.96],可寫為95% C.I. [59.04 , 62.96]
信賴界線為59.04和62.96。
信賴水準:信賴區間涵蓋μ的機率。
→有90%的機率,μ會涵蓋在x̄ ±1.65σx̄的範圍內
→有95%的機率,μ會涵蓋在x̄ ±1.96σx̄的範圍內
→有99%的機率,μ會涵蓋在x̄ ±2.58σx̄的範圍內
二項分配:將次數轉為機率
小明拿出一個公正的硬幣,擲100次,正面出現30次,成功機率p=0.3(p代表點估計)。你懷疑小明的硬幣一點都不公正,你要如何證明?
計算二項分配時,先將次數轉為機率,再來去觀察它是否Np和Nq皆大於5滿足常態分配。例如:100*0.3=30、100*0.7=70,兩者都大於5,是常態分配。可使用z檢定。

- 抽樣分配會因N大小改變
此時的抽樣分配是一個平均數為p、標準差(又稱標準誤)為√ (pq/N)的常態分配。N越大標準誤越小,信賴區間越小,準確估計值越高。

- 標準誤的pq要帶哪一個?
若樣本數夠大(N>100),則可帶樣本所得的p、q。若不夠大,那就先相信小明帶p=0.5、q=0.5進去算。
假設考驗:已知或假設μ,並用x̄ 證明合理性
虛無假設 (null hypothesis, H0)、對立假設 (alternative hypothesis, H1)
兩假設需包含所有的可能性。
研究假設:大華國中女性身高大於160公分
統計假設:H0:μ≦160cm ; H1:μ>160cm
驗證方式:推翻虛無假設
「我只是犯了全天下男人都會犯的錯!」這是很經典的一句話,那要如何證明他是否正確呢?是找遍全世界的男人證明會劈腿嗎?還是找到一個專情的男人就可以否定掉這句話了呢?想必是後者,對吧!
所以當我們要證明A,我們就必須要先推翻非A的言論。此方法稱為「否證法」。
研究假設:全天下男人都會劈腿
統計假設:H0:劈腿次數=0 ; H1:劈腿次數≠0
怎樣才算推翻?設定顯著水準α,進入拒絕區!
顯著水準α是研究者可以自行設定的,通常我們會訂0.05。
若α設太高,H0太容易被推翻;若α設太低,H0太容易被接受。因此,我們需要好好制訂。α又分單尾檢定和雙尾檢定,如下圖所示:

顯著水準單尾檢定、雙尾檢定
連續變項
已知大華國中的女性身高的標準差=9,今天我調查了大華國中25位女同學的身高,得到樣本平均數為162公分。想知道是不是大華國中全體女性平均身高是否大於160公分。

可去以下網站找z-table,求z的臨界值:
二項分配
小明拿出一個公正的硬幣,擲100次,正面出現30次,成功機率p=0.3(p代表點估計)。你懷疑小明的硬幣一點都不公正,你要如何證明?

TYPE I ERROR & TYPE II ERROR
虛無假設一定是不對的嗎?
答案是不一定!他只是我們的假設而已!有可能並不能推翻他,讓我們接受虛無假設的理論。但若今天推翻了,也不代表對立假設一定是正確的。
TYPE I ERROR:H0為真
今天H0是正確的話,當我們接受它,代表我們做了對的決定。若我們推翻他,代表我們做了錯的決定。這個錯誤決定的機率我們又稱為TYPE I ERROR。TYPE I ERROR 的機率又等於α。α是研究者自己決定的,決定好後臨界值就不會改變。
我們要如何避免這個狀況?取樣本數時應隨機,不可太過極端。

TYPE II ERROR:H0為假
今天H0是錯誤的話,當我們推翻它,代表我們做了對的決定。若我們接受他,代表我們做了錯的決定。這個錯誤決定的機率我們又稱為TYPE II ERROR。TYPE I ERROR 的機率又等於β。
在做假設考驗時,我們的期望都是能夠推翻H0,這個機率是1-β,又稱統計檢定力。我們希望這個機率越大越好。

如何增加統計檢定力?
要增加統計檢定力的話,我們需要讓β變小。以下有3種方法可以試試看:
- α、β之間互為消長,我們可以把α訂大一點(但不是一個好方法)
- 改變H0與H1分配的距離(讓TS離H0越遠越好)
- 改變H0與H1分配的標準差(取越多樣本數越好)

改變距離,右圖距離較大

改變標準差,右圖較小
TYPE I ERROR / TYPE II ERROR 比較圖

結論
「理想很豐滿,現實很骨感」z檢定是一個很好用的統計方式,但有許多前提:知道母群標準差、母群非常態時樣本數要夠大。但現實裡,我們往往不知道母群長什麼樣子,也不會知道他的標準差。
因此,t檢定就出來了!t檢定除了計算單一樣本之外,也可以使用在相依樣本、獨立樣本上,會比z檢定在現實中的運用更廣。下一篇章,我們即將討論t檢定在單一樣本下的運用~~