在從樣本回推到母群之前,我們必須先對量數的寫法有所了解:
母群參數:μ、σ
樣本統計數:M、SD
樣本統計數可不可以當成推論母群參數的估計數呢?答案是不一定!統計數需要滿足下面4種特性(尤其是不偏性),才能是好的估計數。
- 不偏性:帶入期望值計算
- 一致性:樣本數增加,估計數通常會越來越接近母群參數
- 有效性:不會因樣本不同而有巨大的變動
- 充分性:用到樣本的所有訊息
最好的估計數是平均值
抽樣分配
一個母群裡,我們可以重複抽取N個樣本數,也可以算出每一個樣本的平均數x̄。此時,這個x̄為點估計。點估計的問題是會因為樣本不一樣而有不同的值,每一個點估計都離母群μ很近,但因為x̄等於μ幾乎不可能,因此,我們會採用區間估計的方式來估計我們母群參數的範圍或驗證假設考驗是否合理。
抽樣分配出來的結果不一定是常態分配。抽樣分配若是常態分配,則可使用中央極限定理解決問題。
中央極限定理(CLT)
當樣本數夠大(N>30)時,不管母群分配長什麼樣子,樣本平均數的抽樣分配都會趨近於常態分配。抽越多次,估計參數越準確。這個分配可適用於CLT,此分配標準差稱之為標準誤(standard error)。
若一個平均數為μ,標準差為σ的母群,他的抽樣分配如下圖所示。此抽樣分配是一個平均數為μ,標準差為σ/√N (標準誤)的常態分配。(常態分配可使用z-table)
使用CLT時,需要有母群標準差。若非常態母群抽取的樣本數不夠大,讓抽樣分配非常態分佈的話,也不行使用。

下章我們會用抽樣分配的概念,教大家推論統計的兩種估計方式:區間估計、假設考驗。下章見囉~~~
若有不懂的部分歡迎留言交流切磋!