上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。
上圖是四次打靶的結果, 做估計就很像在打靶, 左上角的結果看起來大部分都落在紅心上, 這就是我們最想看到的結果, 右上角的圖平均而言有落在紅心上, 但每次出手的結果似乎沒有那麼一致, 左下角的圖則是出手結果很一致, 但平均而言他打歪了, 右下角的圖則是最糟糕的結果, 大家都不樂見。
所謂的平均而言有打中, 我們稱之為準度, 而每次出手的結果接不接近, 我們稱之為精度。為什麼我們一直在強調精度的重要呢? 因為真的去蒐集數據, 算出一個平均數, 就很像是你拿起槍, 深呼吸, 屏氣凝神, 一直到扣下板機, 再靶紙上留下一個洞, 沒錯, 就只有一個。還有一點, 真正在打靶的時候, 你是看不到紅心的 (如果知道紅心在那裡就不需要估計了), 所以你只能從打紙上僅有的一個點, 來推測紅心的位置, 因此這把槍的精度不能太低, 否則以右下角的圖為例, 在紙上只有一個黑點的情況下, 你完全無法想像紅心在哪個位置。(但這不代表槍的準度可以很差, 想想左下角的圖, 以這把槍而言, 你應該會猜測紅心在那團黑黑的地方附近吧!) 至於彈孔的分散程度如何? 我們可以用標準差來衡量。
還記得之前上課時老師給過一個很生動的比喻, 如果點估計是拿魚叉來捕魚, 但你發現自己抓不太到魚的話該怎麼辦呢? 答案是改拿網子來撈。在統計學上, 我們的做法會是這樣: 算出平均數, 往下減1.96個標準差, 往上加1.96個標準差, 就可以做出一個區間, 這個區間涵蓋到紅心的機率就會有95%。所謂的區間其實大家非常熟悉, 一定每個人都有看過, 只是你可能不知道自己看了什麼。舉個例子, 天氣預報, 當颱風來臨時, 我們看到氣象局給出來的路徑預測圖, 氣象局都不會只畫出中間那條線, 而是會再往外擴大範圍, 如下圖所示
這個做法是怎麼來的呢? 大家應該都有聽過, 常態分配正中間是平均值, 往外加減一個標準差可以涵蓋68.27%的人, 往外加減兩個標準差可以涵蓋95.45%, 往外加減三個標準差就可以涵蓋到99.73%, 這就是所謂的三西格馬法則。既然樣本平均數落在母體平均數加減2個標準差的機率是95.45%, 那麼反過來說, 我們只要將樣本平均數加減2個標準差, 我們涵蓋到母體平均數的機率就會有95.45%。
目前為止, 我們有兩個問題需要被解決,
1.從製作區間的時候, 我們用的是1.96個標準差, 但三西馬格法則中, 卻是加減2個標準差?
2.為什麼是常態分配呢? 還有一定是常態分配嗎?
第一個問題比較簡單, 因為在三西格馬法則中我們是站在方便大家計算的角度來看的, 而在做研究報告時, 大家 “約定成俗” 可以接受的誤差分別是10%, 5%, 1%, 我們會抓取95%來做區間, 95%相較於95.45%低一點點, 因此區間會窄一點, 所以會用1.96個標準差, 而非兩個。(註: 其實在學術界上, 多少誤差可以接受的多少是怎麼決定的呢? 答案是之前的人用多少就用多少。因此, 可以接受的誤差是10%, 5% 和1% 三種, 其中又以5% 最常見, 大家常用的p-value小於0.05也是同樣的概念, 之後有機會再寫一篇來說明p-value。)
至於第二個問題要說明清楚除了需要一點理論基礎外, 也涉及到一點數學計算, 有興趣的朋友歡迎來信詢問。
許多人會在計算出區間後, 寫下這樣的敘述:
母體平均數落在 (0.3, 0.5) 之間的機率是95%
這樣的說法是有瑕疵的, 雖然我們不知道母體平均數是多少, 但他是存在的一個數, 只是我們不知道他是多少而已, 因此當你抽樣完, 算出區間是0.3到0.5的時候, 母體平均數落在這個區間的機率不是0就是1, 只是我們不知道是哪個。那我們該怎麼解釋這個結果呢? 我們會說: 我有95%的 ”信心”, 這個區間會涵蓋到母體平均數, 因此區間估計又被稱作信賴區間。這就好比, 今天你跟另一半在滾床單前, 讓對方吃下了事前避孕藥, 這時候你可以說這個藥可以成功避孕的機率有95%, 但一陣大汗淋漓, 翻雲覆雨後, 你射進了對方的身體裡, 這時候就有中就有中, 沒中就沒中, 沒有什麼95%的機率了, 但你可以說因為有吃事前, 所以你有95%的信心這次不會懷孕。提醒: 就像前幾篇文章中說的, 在做決策前, 我們應該想的是萬一中了我能不能承擔, 代價有多大, 而不是自己很有信心, 然後全部都交給機率, 聽天由命。
會特別把事前事後拿出來談是因為很多大學學生在做解釋時, 總是使用前面我們特別highlight起來的錯誤敘述, 讓大學教授很苦惱 (我至少聽過3個不同的老師抱怨這件事)。其實這段在高中數學裡是有提到的, 只是相較於大學, 高中時期對於結果的解釋相對沒那麼注重, 因此當初沒有注意到細節的朋友, 升上大學後就會讓教授感覺到非常困擾。
相較於之前的文章, 我們將資料的分散程度考慮進來, 並介紹了一種可以同時考慮兩個資訊的統計學工具 (在做區間估計時, 我們同時使用了平均數和標準差), 希望大家以後看到報導底下網友為了平均數或中為數是多少吵得不可開交時, 冷靜想想除了發文跟吵架者的目的外, 是不是因為給出來的資訊太少了, 才會讓大家吵成這樣。