心統 | 推論統計 | 從z檢定看區間估計、假設考驗

小梁-avatar-img
發佈於心統
更新 發佈閱讀 6 分鐘
z檢定使用時機:已知母群標準差、若母群為非常態,需要抽取樣本數N>30。
(備註:常態分配時,才能夠使用。也是唯一能使用CLT的檢定方式)

區間估計:從x̄ 猜測μ範圍

連續變項

設x̄ 是一個N(61,1)的常態分配,信賴水準95%的情況下,μ的信賴區間為?

先確認是否可以使用z檢定:常態分配、已知抽樣分配標準誤為1。可以!
信賴水準95%是在x̄ ±1.96σ的範圍內,因此x̄ -1.96σ < μ < x̄ +1.96σ,帶入數值(x̄ =61、σ= 1),59.04 < μ < 62.96。
信賴區間為[59.04 , 62.96],可寫為95% C.I. [59.04 , 62.96]
信賴界線為59.04和62.96。

信賴水準:信賴區間涵蓋μ的機率。
→有90%的機率,μ會涵蓋在x̄ ±1.65σ的範圍內
→有95%的機率,μ會涵蓋在x̄ ±1.96σ的範圍內
→有99%的機率,μ會涵蓋在x̄ ±2.58σ的範圍內

二項分配:將次數轉為機率

小明拿出一個公正的硬幣,擲100次,正面出現30次,成功機率p=0.3(p代表點估計)。你懷疑小明的硬幣一點都不公正,你要如何證明?

計算二項分配時,先將次數轉為機率,再來去觀察它是否NpNq皆大於5滿足常態分配。例如:100*0.3=30、100*0.7=70,兩者都大於5,是常態分配。可使用z檢定。

raw-image


  • 抽樣分配會因N大小改變

此時的抽樣分配是一個平均數為p、標準差(又稱標準誤)為√ (pq/N)的常態分配。N越大標準誤越小,信賴區間越小,準確估計值越高。



raw-image
  • 標準誤的pq要帶哪一個?

若樣本數夠大(N>100),則可帶樣本所得的pq。若不夠大,那就先相信小明帶p=0.5、q=0.5進去算。

假設考驗:已知或假設μ,並用x̄ 證明合理性

虛無假設 (null hypothesis, H0)、對立假設 (alternative hypothesis, H1)
兩假設需包含所有的可能性。
研究假設:大華國中女性身高大於160公分
統計假設:H0:μ≦160cm ; H1:μ>160cm

驗證方式:推翻虛無假設

「我只是犯了全天下男人都會犯的錯!」這是很經典的一句話,那要如何證明他是否正確呢?是找遍全世界的男人證明會劈腿嗎?還是找到一個專情的男人就可以否定掉這句話了呢?想必是後者,對吧!

所以當我們要證明A,我們就必須要先推翻非A的言論。此方法稱為「否證法」

研究假設:全天下男人都會劈腿
統計假設:H0:劈腿次數=0 ; H1:劈腿次數≠0

怎樣才算推翻?設定顯著水準α,進入拒絕區!

顯著水準α是研究者可以自行設定的,通常我們會訂0.05。

若α設太高,H0太容易被推翻;若α設太低,H0太容易被接受。因此,我們需要好好制訂。α又分單尾檢定雙尾檢定,如下圖所示:

顯著水準單尾檢定、雙尾檢定

顯著水準單尾檢定、雙尾檢定

連續變項

已知大華國中的女性身高的標準差=9,今天我調查了大華國中25位女同學的身高,得到樣本平均數為162公分。想知道是不是大華國中全體女性平均身高是否大於160公分。
raw-image

可去以下網站找z-table,求z的臨界值:

二項分配

小明拿出一個公正的硬幣,擲100次,正面出現30次,成功機率p=0.3(p代表點估計)。你懷疑小明的硬幣一點都不公正,你要如何證明?
raw-image

TYPE I ERROR & TYPE II ERROR

虛無假設一定是不對的嗎?

答案是不一定!他只是我們的假設而已!有可能並不能推翻他,讓我們接受虛無假設的理論。但若今天推翻了,也不代表對立假設一定是正確的。

TYPE I ERROR:H0為真

今天H0是正確的話,當我們接受它,代表我們做了對的決定。若我們推翻他,代表我們做了錯的決定。這個錯誤決定的機率我們又稱為TYPE I ERROR。TYPE I ERROR 的機率又等於α。α是研究者自己決定的,決定好後臨界值就不會改變。

我們要如何避免這個狀況?取樣本數時應隨機,不可太過極端。

raw-image

TYPE II ERROR:H0為假

今天H0是錯誤的話,當我們推翻它,代表我們做了對的決定。若我們接受他,代表我們做了錯的決定。這個錯誤決定的機率我們又稱為TYPE II ERROR。TYPE I ERROR 的機率又等於β。

在做假設考驗時,我們的期望都是能夠推翻H0,這個機率是1-β,又稱統計檢定力。我們希望這個機率越大越好。

raw-image

如何增加統計檢定力?

要增加統計檢定力的話,我們需要讓β變小。以下有3種方法可以試試看:

  1. α、β之間互為消長,我們可以把α訂大一點(但不是一個好方法)
  2. 改變H0與H1分配的距離(讓TS離H0越遠越好)
  3. 改變H0與H1分配的標準差(取越多樣本數越好)
改變距離,右圖距離較大

改變距離,右圖距離較大

改變標準差,右圖較小

改變標準差,右圖較小

TYPE I ERROR / TYPE II ERROR 比較圖

raw-image

結論

「理想很豐滿,現實很骨感」z檢定是一個很好用的統計方式,但有許多前提:知道母群標準差、母群非常態時樣本數要夠大。但現實裡,我們往往不知道母群長什麼樣子,也不會知道他的標準差。

因此,t檢定就出來了!t檢定除了計算單一樣本之外,也可以使用在相依樣本、獨立樣本上,會比z檢定在現實中的運用更廣。下一篇章,我們即將討論t檢定在單一樣本下的運用~~

留言
avatar-img
留言分享你的想法!
avatar-img
小梁的沙龍
0會員
71內容數
心理小白,撰寫一些心理學習的紀錄和其他想分享的事物!喜歡的話歡迎關注和按愛心給予支持喔~
小梁的沙龍的其他內容
2025/06/23
我們將要試著從樣本回推到母群,在開始之前,我們必須先對量數的寫法有所了解: 母群參數:μ、σ 樣本統計數:M、SD 而樣本統計數可不可以當成推論母群參數的估計值呢?答案是不一定!統計數需要滿足下面3種特性(尤其是不偏性),才能是好的估計數。 不偏性:帶入期望值計算 一致性:樣本數增加,估計數
Thumbnail
2025/06/23
我們將要試著從樣本回推到母群,在開始之前,我們必須先對量數的寫法有所了解: 母群參數:μ、σ 樣本統計數:M、SD 而樣本統計數可不可以當成推論母群參數的估計值呢?答案是不一定!統計數需要滿足下面3種特性(尤其是不偏性),才能是好的估計數。 不偏性:帶入期望值計算 一致性:樣本數增加,估計數
Thumbnail
2025/06/23
二項式分配 基本概念 二項式分配只能使用在間接變項上,探討的是N個獨立的二分(成功、失敗)試驗。 若把成功機率設為p,則p=0.5時,是常態分配。p<0.5時,分配是正偏態;p>0.5時,分配是負偏態。 除了p=0.5外,有其他方法讓分配趨近常態分配嗎 有的!不管p、q值為何,只要N很大的
Thumbnail
2025/06/23
二項式分配 基本概念 二項式分配只能使用在間接變項上,探討的是N個獨立的二分(成功、失敗)試驗。 若把成功機率設為p,則p=0.5時,是常態分配。p<0.5時,分配是正偏態;p>0.5時,分配是負偏態。 除了p=0.5外,有其他方法讓分配趨近常態分配嗎 有的!不管p、q值為何,只要N很大的
Thumbnail
2025/06/21
常態分配:常見事物的分配 我們透過觀察可以知道很多事物的分配呈現常態分配,例如:IQ、身高、兩顆骰子擲的點數等等。不管是間接變項或是連續變項,只要分配呈現左右對稱就可以稱之為常態分配。 常態分配為什麼重要 就像我們剛剛所說的,世界上許多事情是常態分配,所以當我們不確定我們要推論的事情是什麼分配
Thumbnail
2025/06/21
常態分配:常見事物的分配 我們透過觀察可以知道很多事物的分配呈現常態分配,例如:IQ、身高、兩顆骰子擲的點數等等。不管是間接變項或是連續變項,只要分配呈現左右對稱就可以稱之為常態分配。 常態分配為什麼重要 就像我們剛剛所說的,世界上許多事情是常態分配,所以當我們不確定我們要推論的事情是什麼分配
Thumbnail
看更多
你可能也想看
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
2023.1.15 設x求一個未知,有兩個就加y。
Thumbnail
2023.1.15 設x求一個未知,有兩個就加y。
Thumbnail
抽樣方式影響調查的樣本結果是否可以代表母體狀況。方便抽樣可能導致偏誤,應考慮更系統化的抽樣方法,例如簡單隨機抽樣,以確保樣本情況可以回推母體情況。文章透過範例說明,解釋樣本和母體之間關聯。
Thumbnail
抽樣方式影響調查的樣本結果是否可以代表母體狀況。方便抽樣可能導致偏誤,應考慮更系統化的抽樣方法,例如簡單隨機抽樣,以確保樣本情況可以回推母體情況。文章透過範例說明,解釋樣本和母體之間關聯。
Thumbnail
高中數學主題練習—變異數與標準差計算
Thumbnail
高中數學主題練習—變異數與標準差計算
Thumbnail
高中數學主題練習—求空間中直線參數式
Thumbnail
高中數學主題練習—求空間中直線參數式
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News