信賴區間(Confidence interval)是一種用於評估母體參數的區間估計方法。常見的形式為估計值+-誤差界限
。如果是想要估計母體的平均數的話,可以採用下圖公式進行計算,下圖X代表樣本平均數(解釋請看這篇文章),Z為臨界值(等等解釋),s代表樣本的標準差(解釋請看這篇文章),n就是樣本數量。
不同的信水準有不同的臨界值,95對應的Z值是1.96,從下圖可以看出在Z值正負1.96的標準差範圍內為機率為95%, 約有 95%的資料落此範圍內。如果想要用99%信賴區間,那對應的就是將臨界值改成2.58。但這樣的話誤差界限也會改變,導致信賴區間變得更長包含更大的範圍。
要注意的是信賴區間的解讀,不能說成這個區間有95機率包含母體平均數。因為只根據一個樣本,此樣本算出來的信賴區間已經固定,而母體的平均數也是固定的常數(雖然未知),既然都是固定的就不會是95%,要就是有包含,不然就沒有。
如果要解釋的話,就要回到分布進行解釋,我們必須反覆抽樣,抽出多個樣本平均數,然後形成一個樣本平均數分配圖(如上圖),雖然我們並不知道母體平均數確切位置,但只有抽的數量夠多,我們相信母體平均會越來越居中(接近Z=0)。只要是採用簡單隨機抽樣,然後樣本數夠大,基本上都會接近常態分派,也就是接近Z分數分配的形狀。這就是為何我們要選擇Z分數作為臨界值。
同時,每抽一次樣本,就用樣本的數值放進信賴區間公式x±1.96*s√n
如下圖反覆進行抽樣,假設對母體做 100 次抽樣後,將這 100 個信賴區間求出來,在這麼多的信賴區間中, 約有 95%的機率落在這些信賴區間中,也就是說大約有 95 個信賴區間會包含母體平均數。
您的研究遇到了統計分析的困難嗎?您需要專業的統計諮詢和代跑服務嗎?請點我看提供的服務