為什麼信心水準不是機率?

更新 發佈閱讀 7 分鐘

這是很多統計學初學者會有的疑惑。大部分的統計數據呈現,像是人口調查、民調等等,都會利用抽樣來推估真實值,並在抽樣的結果附近加上一段信賴區間,可以簡單理解為誤差範圍(如果涉及統計推論則會呈現 p 值)。那個範圍會有他對應的信心水準,但很多人將其理解為「真實值落在這個範圍內的機率」,然而這其實是錯誤的。

我在網路上幫高中生解題多年(雖然課綱現在把信賴區間刪掉了),發現造成這樣錯誤解讀的根本原因是大家對於「抽樣分佈(sample distribution)」,也就是 X̄(樣本平均)的機率分布的理解不正確導致。


▍什麼是抽樣分佈?

假設今天我們對一個母體(比方說全台灣的人口)進行抽樣,母體的平均和標準差是 μ 和 σ(這兩個我們當然不知道是多少),且每次抽樣取 n 個樣本。第一次抽樣之後得到 n 個數據,然後算它的平均,就會得到第一次的樣本平均 X̄₁,然後再進行第二次抽樣,也是抽 n 個數據,得到第二次的 X̄₂,以此類推,直到從母體抽出 n 個樣本的所有可能都抽完。很明顯每一次的 X̄ 幾乎都不同,因為每次抽樣得到的樣本是隨機的。

注意一下 n 不是抽樣的次數,是每次抽樣的樣本數。總共抽樣幾次得看母體有多大,有多少可能抽出的組合,造成各種可能的 X̄ 值,最後當所有的 X̄ 值都抽到了,還有抽到這個值的次數,就可以知道得到各個 X̄ 值發生的機率,所以 X̄ 是隨機變數。我們將這個機率分布畫出來,橫軸是 X̄ 的各種可能值,縱軸是它發生的機率,這就是「抽樣分佈」。

統計學家分析這個分佈的性質得到了「中央極限定理(central limit theorem, CLT)」,證明有點複雜所以通常教科書只會寫以下結論:

  1. 抽樣分佈的平均正好是母體平均 μ。
  2. 抽樣分佈的標準差是母體標準差 σ 除以 √n。
  3. 如果 n 夠大的話,抽樣分佈會接近常態分佈。

稍微分析一下這結果:第三條說這分佈會呈現出鐘型曲線,可見這分佈的平均大概在中央最高峰處,而且第一條告訴你它等於母體平均,也就是說樣本平均和母體平均的機率超高,這相當直觀;第二條則說明了抽出的樣本平均之間的差異程度,比單獨觀測母體的各個值的差異程度還小(因為 n 是正整數),這也很好理解,畢竟你觀察了更多值,只是證明就是個大工程了。

原本母體的數據可以是隨便一個分佈(高中的話就是拿二項分布當母體),但 X̄ 的機率分佈是常態分佈,兩者完全不同概念!你可能想說,我們怎麼可能抽完母體的所有抽樣可能?如果母體是全台灣 2300 萬人,我每次抽樣 10 人,抽樣的可能數(C 23000000 取 10)大概是 1.14×10⁶⁷,這最好抽的完?

不是的,我們現在根本還沒實際進行抽樣,以上都是在抽樣前,對於抽樣這件事所進行的事先分析,當你看清了這點,你應該就想通抽樣分佈是什麼了。

抽樣分佈是實際抽樣前對 X̄ 的機率分析,並由中央極限定理說明其性質。

▍信賴區間和信心水準

之所以做以上的分析是要讓你了解 X̄ 的行為,接下來你只需要進行一次抽樣得到一個 X̄,就能利用抽樣分佈來告訴你這數據有多可靠。那你抽樣出的樣本平均有沒有等於母體平均呢?答案是:要嘛有,要嘛沒有嘛!

信賴區間(confidence interval)是什麼?它是你得到的 X̄ 所展開的一定範圍,畢竟除非你的籤運好的離譜,不然你應該不會很有自信地聲稱你的 X̄ 就是母體的平均 μ,所以要展開一段區間作為誤差範圍,保守一點地說 μ 在這裡面。這個範圍要取多大是你決定,如果取的超大,你自然就有更高的信心來宣稱這範圍涵蓋 μ,這個信心程度就是所謂的信心水準(confidence level)

當然你也可以取到讓整個信賴區間涵蓋所有 X̄ 的可能值,然後說你有 100% 的信心這會涵蓋 μ,那這就只是個廢話。就好像你想知道台灣人平均年齡,抽了一個樣本出來後說平均年齡在 0 到 1000 歲之間,那其實跟沒說一樣。所以信賴區間能夠取的越小越好,但越小的話信心水準肯定會下降,也不能取太小,要自己在這兩者間權衡。

信賴區間越小越好,與此同時,其信心水準要越高越好。

那信心水準怎麼算,總不是靠感覺來說自己多有信心吧?

從中央極限定理知道抽樣分佈是常態分佈,為了方便查表,統計學常把數據標準化,將原始數據扣掉平均,再除以標準差,這樣平均就平移到 0,標準差則伸縮成 1,這東西就是「z 分數(z-score)」。中央極限定理也已經告訴你抽樣分佈的平均和標準差是多少,則公式如下:

raw-image

當機率分佈橫軸的隨機變數標準化後,一切就好辦了,例如如果我想求抽樣得到的 X̄ 換算成 z 分數後,這個值落在中央的 μ(其值為 0)往左右展開一個標準差(加減 1)的機率,那就將這個常態分佈的機率函數積分,算 ±1 之間的曲線下面積,相較於曲線下的總面積(其實就是 1,因為是機率函數)的比值。

由於平均和標準差的標準化,這個常態分佈的函數是固定的,那就可以建出固定的表,以後只要查表就能知道你要的曲線下面積。

而我們可以發現,在 ±1 之間(加減 1 個標準差)的曲線下面積是 0.682、±2(加減 2 個標準差)的則是 0.954、±3(加減 3 個標準差)的則是 0.997,這一般被稱為「68-95-99.7 的經驗法則(empirical rule)」因為這比例早在 18 世紀初就被觀察到,而不是計算出來的。

以加減 2 個標準差為例,用數學式表達的話就是:

raw-image

接著將 z 分數的公式代入移項,讓 μ 在中間:

raw-image

這告訴我們:如果我們抽樣的話,抽出來的 X̄ 加減 2 個標準差的區間內涵蓋 μ 的機率是 95.4%。這是機率,但再次提醒,現在還只是抽樣前進行的分析

現在實際進行抽樣,會得到一個固定的 X̄ 值,此時 X̄ 不再是隨機變數,它展開的信賴區間有沒有涵蓋 μ 已變成既定事實(儘管你不知道到底有沒有),而 μ 也不是隨機變數,哪來的機率可言?

我們只能回顧抽樣分佈,得知對於所有可能的 X̄ 值,有 95.4% 涵蓋了 μ。如果我還沒進行抽樣的話,那麼我有 95.4% 的機率會抽到展開的信賴區間涵蓋 μ 的 X̄ 值;但我進行抽樣後事已成定局,我的信賴區間要嘛有涵蓋 μ,要嘛沒有,雖然不知道有沒有,但我有 95.4% 的信心宣稱有,基於先前抽樣分佈的分析。

抽樣後的 X̄ 不再是隨機變數,所以原先的機率僅是信心水準的參考依據,而信心水準本身並不是機率。

本文同步發佈於 Matters
  • 如果喜歡我的文章,還請不吝❤️按下愛心】 、【👏拍手】、【追蹤】
  • 我平常更常在 instagram 發布短文,等內容累積到一定的量後才會整理出完整文章發布在這,也歡迎有興趣的讀者來逛:@study.msh
留言
avatar-img
留言分享你的想法!
avatar-img
靖之的沙龍
33會員
9內容數
從數萬年前舊石器時代點燃的第一竄火苗,到20世紀衝出大氣層的第一艘火箭,人類是如何用自己的雙手將原始叢林構築成現今的世界?處在歷史洪流最前端的我們,欲知為何自己身在此地、未來將何去何從,勢必要回顧河流的路徑、探索知識的源頭、瀏覽科學的歷史,鑑往以知來。
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
這本書在我到書單中躺了很久,近期常常會思考著機率與人生際遇的關係,在某個人事物的環境下,為什麼會遇到很特別的,尤其是專家所宣稱的低機率事件發生,或是遇到環環相扣的巧合,這個疑問充滿著我的內心,這本書帶給我一些獨特的觀點去切入觀察,我先從基本知識探討信賴區間的本質開始談起。
Thumbnail
這本書在我到書單中躺了很久,近期常常會思考著機率與人生際遇的關係,在某個人事物的環境下,為什麼會遇到很特別的,尤其是專家所宣稱的低機率事件發生,或是遇到環環相扣的巧合,這個疑問充滿著我的內心,這本書帶給我一些獨特的觀點去切入觀察,我先從基本知識探討信賴區間的本質開始談起。
Thumbnail
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
Thumbnail
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
Thumbnail
機率,一個我們從小就會接觸到的名詞。 在開啟交易新手村的時候,便發現自己其實很不喜歡機率這件事,並非我不相信而是自己認為的機率只有0%或是100%。 其中的1%~99%我都認為它們不存在,但現在我已經慢慢接受這件事了。 但我發現人們對於機率的解讀存在著「巨大的差異」。(這實在是太有趣啦啦啦啦!) 例
Thumbnail
機率,一個我們從小就會接觸到的名詞。 在開啟交易新手村的時候,便發現自己其實很不喜歡機率這件事,並非我不相信而是自己認為的機率只有0%或是100%。 其中的1%~99%我都認為它們不存在,但現在我已經慢慢接受這件事了。 但我發現人們對於機率的解讀存在著「巨大的差異」。(這實在是太有趣啦啦啦啦!) 例
Thumbnail
這是很多統計學初學者會有的疑惑。大部分的統計數據呈現,像是人口調查、民調等等,都會利用抽樣來推估真實值,並在抽樣的結果附近加上一段信賴區間,可以簡單理解為誤差範圍(如果涉及統計推論則會呈現 p 值)。那個範圍會有他對應的信心水準,但很多人將其理解為「真實值落在這個範圍內的機率」,然而這其實是錯誤的。
Thumbnail
這是很多統計學初學者會有的疑惑。大部分的統計數據呈現,像是人口調查、民調等等,都會利用抽樣來推估真實值,並在抽樣的結果附近加上一段信賴區間,可以簡單理解為誤差範圍(如果涉及統計推論則會呈現 p 值)。那個範圍會有他對應的信心水準,但很多人將其理解為「真實值落在這個範圍內的機率」,然而這其實是錯誤的。
Thumbnail
#67《聰明思考》(下):我們怎麼樣得出「客觀」結論?說到客觀資訊可定脫離不了實驗與實驗結果的解讀,而判斷這些事情正是數學中統計上在做的事!欸欸!等等!別看到數學就想關掉啊!要理解這些不需要用到艱澀的數學概念,我們只要理解它們可以用在怎麼樣的情境裡、如何避免偏誤解讀,就可以利用統計的想法來幫助我們!
Thumbnail
#67《聰明思考》(下):我們怎麼樣得出「客觀」結論?說到客觀資訊可定脫離不了實驗與實驗結果的解讀,而判斷這些事情正是數學中統計上在做的事!欸欸!等等!別看到數學就想關掉啊!要理解這些不需要用到艱澀的數學概念,我們只要理解它們可以用在怎麼樣的情境裡、如何避免偏誤解讀,就可以利用統計的想法來幫助我們!
Thumbnail
好久不見了,大家。時間被研究工作排滿,加上我堅持11點睡覺,所以犧牲掉的就是我的部落格寫作。這是我參與讀書會所負責導讀的章節,《反智》的第四部。
Thumbnail
好久不見了,大家。時間被研究工作排滿,加上我堅持11點睡覺,所以犧牲掉的就是我的部落格寫作。這是我參與讀書會所負責導讀的章節,《反智》的第四部。
Thumbnail
統計方法是生態學量化研究的重要工具。觀念不清、使用不慎,使分析結果貽笑大方就算了;若據以擴張解釋並影響決策,其後果就非同小可。最怕的是濫用統計工具,以期達到預設的研究結果,那就涉及科學態度與科學倫理了。 最常見的錯誤觀念是標準差、標準誤、以及邊際誤差混淆不清,卻不自知。
Thumbnail
統計方法是生態學量化研究的重要工具。觀念不清、使用不慎,使分析結果貽笑大方就算了;若據以擴張解釋並影響決策,其後果就非同小可。最怕的是濫用統計工具,以期達到預設的研究結果,那就涉及科學態度與科學倫理了。 最常見的錯誤觀念是標準差、標準誤、以及邊際誤差混淆不清,卻不自知。
Thumbnail
  上次談到幾項閱讀完《真確》後的心得,包括少子化與經濟無關、學生沒有比當年的我們爛、媒體識讀能力來自不斷學習、核能存廢問題、covid19疫苗在台施打死亡率問題、covid19不該叫武漢肺炎、責任政治的濫用、民粹議題等諸多台灣的社會現況(詳見讀《真確》—台灣社會議題的再思考(上)一文)。   這次
Thumbnail
  上次談到幾項閱讀完《真確》後的心得,包括少子化與經濟無關、學生沒有比當年的我們爛、媒體識讀能力來自不斷學習、核能存廢問題、covid19疫苗在台施打死亡率問題、covid19不該叫武漢肺炎、責任政治的濫用、民粹議題等諸多台灣的社會現況(詳見讀《真確》—台灣社會議題的再思考(上)一文)。   這次
Thumbnail
《心得分享-隨機漫步的傻瓜》 讀完這本書的時候,我有一種奇怪的感覺,似乎這本書的內容是在描述我的行為,這感覺就像自己之前做過的作品,看到別人用另一種方式呈現,有一種似曾相似,卻又帶點不同,那不同之處,就是我帶有質疑。 事實上,身為一個相關專業者,我對機率與隨機性的認知超越多數人,只因為多數人並沒有深
Thumbnail
《心得分享-隨機漫步的傻瓜》 讀完這本書的時候,我有一種奇怪的感覺,似乎這本書的內容是在描述我的行為,這感覺就像自己之前做過的作品,看到別人用另一種方式呈現,有一種似曾相似,卻又帶點不同,那不同之處,就是我帶有質疑。 事實上,身為一個相關專業者,我對機率與隨機性的認知超越多數人,只因為多數人並沒有深
Thumbnail
「如果你沒有獨立思考,那你就沒有可控感」 因為可控感是由自身透過自己思維而延伸出來的一種堅定、安全、平衡的感覺 用三種常見的缺乏獨立思考的狀況,來解釋不同面向的獨立思考 與如何去建立獨立思考的能力 【迷信】打破沙鍋的精神 質疑的能力 迷信跟「信仰」是兩回事,一個具備堅持不懈特質的人,都是有信仰的
Thumbnail
「如果你沒有獨立思考,那你就沒有可控感」 因為可控感是由自身透過自己思維而延伸出來的一種堅定、安全、平衡的感覺 用三種常見的缺乏獨立思考的狀況,來解釋不同面向的獨立思考 與如何去建立獨立思考的能力 【迷信】打破沙鍋的精神 質疑的能力 迷信跟「信仰」是兩回事,一個具備堅持不懈特質的人,都是有信仰的
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News