方格子 vocus

統計急救箱─什麼是推論統計？

Way

發佈於社會科學初心者的統計急救箱

2024/10/14 更新2023/10/15 發佈閱讀 5 分鐘

　　自從上一篇當中宣布要進到推論統計的部分後，我就不斷在思考到底該怎麼切入推論統計的解釋。

　　推論統計不只是學生在學習的時候會感覺到很頭痛，其實連解釋推論統計都滿不容易的。仔細回想自己逐漸了解推論統計的過程，真的很仰賴不斷琢磨後突然頓悟的那一瞬間。

　　不知不覺就想了三週，雖然不見得想到了最好的解釋，但還是先開始動筆吧。希望之後的文章都能更加聚焦一些，也能縮短一下篇幅。

　　這篇文的目標就是回答「到底推論統計是什麼？」這個問題。

描述統計與推論統計

　　這兩種統計分類就如同它們的名字一樣，其實是有著不同功能的統計技術。

敘述統計：目的是對資料（資訊）進行描述。
推論統計：目的是利用可觀測到的部分資料，推論出全體資料的特性。

描述統計的用途滿好懂的，其實也可以說是一種簡化、歸納、整理資料的技術。例如台北一年下雨幾天（計數）、不同手搖飲料店的珍奶平均多少錢（平均值）、台灣人薪資水準的中間值（中位數）等等。這些敘述統計都是把很龐大的一筆資料簡化成一個好懂的數值，藉此傳遞資訊。

　　那我們為什麼需要推論統計呢？推論統計到底推論的是什麼？

　　針對一群數字進行描述統計，那就只能理解那一群數字了。例如我描述了某間小學1年3班的數學小考平均成績，跟1年4班的同學就沒有關係，跟2年3班的同學也不會有關係。這個平均成績就只能代表1年3班，不能超出這個班級。

　　假如我想知道的是整間學校的數學考試平均數也不難，只要知道全校同學的數學成績就好了。

　　如果我更過分，想要知道的是全台北市所有國小的數學考試平均分數呢？好像難度就比較高了。那如果是全台灣小學呢？這理論上其實還是能做到的。只是在這個越來越大的範圍當中，我們發現執行起來會越來越不容易，同時執行成本也會越來越高。

　　學校本來就有考試，因此數學成績還算比較容易取得。但世界上存在很多我們根本難以通盤調查的資料，例如全台灣成人的智力分數。在實務上不僅僅是成本考量，更可能是有些人他就不願意提供這些資料。因此我們不可能想要研究什麼，就去對全台灣人鉅細靡遺地做調查。

　　蒐集不到完整的資料該怎麼辦呢？那我們就只好改用其他替代方案。例如在網路上散播問卷請人填寫，或者從每個縣市、每個區域抽出一些人當作是該區域的代表。

　　無論用什麼方法，都有一個共通點──我們蒐集的只有一部份的資料（每個區域只蒐集一些人的數據)，但我們想要了解的卻是整體（全台灣人）的特性。這就是推論統計可以幫助我們的時候了。

母體、抽樣以及樣本是什麼？

　　在統計學上有一些術語來描述上面所提到的事情。假如我們想要了解全台灣成人的智力平均得分，這個「全台灣人」被稱為母體 (population)。

　　而我們挑選了其中一些人出來測量他們的分數，這些實際上被測量到的人，我們稱為樣本 (sample)。

　　從母體挑選樣本的過程，我們稱為抽樣 (sampling，這是個動詞)。

　　下圖是一個摸彩的例子。假如公司尾牙要抽獎，主持人請數據分析小組的4位同仁上台，每個人從袋子裡面摸出一顆球，根據顏色來決定獎品。這個黑色大袋子裡面所有的球就是母體；4個人抽出的球就叫做樣本；而從袋子裡面摸出球來的這個行為，就稱為抽樣。

母體經過抽樣會產生出樣本

　　實際上我們是沒辦法看到袋子裡面的球，只能看到抽出來的4顆球長成什麼樣子。所以統計學家就會使用抽出來的球回頭推論袋子裡面的球大概是怎麼樣的分布。

母體是看不見的，所以才需要用樣本來推論

　　放在前面的成人智力分數也是一樣的。因為對全台灣成人調查智力是難以實現的（母體未知），因此僅對部分台灣成人進行施測（樣本），並根據樣本得到的結果回頭推論母體的特性。

　　光這樣解釋，聽起來有點像是魔法。但也可以理解成用觀察到的數據，用符合邏輯與數學原理的方式去「猜測」母體的樣貌。事實上推論統計推估出來的往往會是一個範圍，而不是鐵口直斷就說是哪個數值。

推論統計比敘述統計優秀嗎？

　　推論統計在統計的學習路徑當中，一定是比敘述統計更晚學習。同時，多數學生應該也會認為推論統計比敘述統計更加困難不好理解。在社會科學研究當中，論文的發表通常也會以推論統計作為主要分析手段。

　　這是否就表示推論統計比敘述統計更為優秀，如果可以我們應該盡量使用推論統計而不是敘述統計呢？

　　其實並不是這樣的。如同前面提到的，敘述統計與推論統計可以說是功能不同的兩種統計技術，只不過推論統計需要使用到敘述統計的技術而已。在實務上，更應該先知道自己要用統計「回答什麼問題」，才能接著決定要用什麼統計技術。

應該根據目的選擇使用推論統計或描述統計

　　如果是像上面所說，我們難以蒐集到全體母體的資料，只好退而求其次蒐集部分樣本。但我們還是想要知道母體的特徵（我們關注的還是母體），此時就應該使用推論統計。

　　但也有很多時候，母體的資料（我們想關注的群體）已經存在了。例如某電商公司想要分析會員們購買某個品項的平均數目，那他們只要使用敘述統計就好。因為對於當前的目的來說，非會員的購買行為不是他們所關注的問題，不需要將統計結果推論到非會員身上。

　　所以先決定問題（通常也會同時決定母體），才是真正決定要使用哪一種統計技術的因素喔！

　　母體除了會影響我們要用什麼統計技術之外，抽樣的方法其實也有可能會影響到推論統計的準確性。

　　推論統計乍聽之下簡直有點像占卜，不過慢慢就會知道並沒有這麼神奇，很多估計與猜測都是建立在許多的假設前提上才能進行的。

　　以上就是關於推論統計的概念性介紹囉！實際要怎麼做推論，後面再慢慢說明吧。

統計急救箱的沙龍社會科學初心者的統計急救箱

留言

統計急救箱的沙龍

76會員

32內容數

大學念文組，碩士班的報告突然要用統計了怎麼辦？沒學過統計怎麼寫量化學位論文？跟著統計書操作都沒問題，但報表都不知道在講什麼，也不知道做的分析到底對不對？作者在應用統計的路上跌跌撞撞也差不多十年了，希望有些心得可以幫助到有這些困擾的你。

統計急救箱的沙龍的其他內容

2024/12/29

統計急救箱─使用獨立t test的時機與前提

　　上回講了獨立樣本t test的運作原理，不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test，以及在什麼條件下可以使用獨立樣本t test？

2024/12/29

統計急救箱─使用獨立t test的時機與前提

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

看更多

你可能也想看

方格子 vocus 官方沙龍

【 vocus 全站慶，更好的 2026 上線了！】折扣碼 x 抽紅包 x 新手禮 x App 登場！

vocus 慶祝推出 App，舉辦 2026 全站慶。推出精選內容與數位商品折扣，訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包，以及全站徵文，並邀請你一起來回顧過去的一年， vocus 與創作者共同留下了哪些精彩創作。

#vocus#2026#vocus2026

2026/01/26

方格子 vocus 官方沙龍

【 vocus 全站慶，更好的 2026 上線了！】折扣碼 x 抽紅包 x 新手禮 x App 登場！

#vocus#2026#vocus2026

2026/01/26

統計急救箱的沙龍

統計急救箱─抽樣分布與中央極限定理（一）

　　這幾天因為選舉民調的關係，統計學一下子受到了大眾的矚目。應該很多人都經由這個機會回想起了一些曾經學過的統計學名詞，例如抽樣、區間、抽樣誤差等等。　　其實這些通通都是推論統計的觀念，網路上有相當多的統計專家已經撰文解釋到底這個民調風波在吵什麼，應該不需要我野人獻曝了。　　不過如果真的想要了

#統計#社會科學#統計急救箱

2023/11/19

統計急救箱的沙龍

統計急救箱─抽樣分布與中央極限定理（一）