區間估計

更新於 發佈於 閱讀時間約 5 分鐘

上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。

準度、精度

raw-image

上圖是四次打靶的結果, 做估計就很像在打靶, 左上角的結果看起來大部分都落在紅心上, 這就是我們最想看到的結果, 右上角的圖平均而言有落在紅心上, 但每次出手的結果似乎沒有那麼一致, 左下角的圖則是出手結果很一致, 但平均而言他打歪了, 右下角的圖則是最糟糕的結果, 大家都不樂見。

所謂的平均而言有打中, 我們稱之為準度, 而每次出手的結果接不接近, 我們稱之為精度。為什麼我們一直在強調精度的重要呢? 因為真的去蒐集數據, 算出一個平均數, 就很像是你拿起槍, 深呼吸, 屏氣凝神, 一直到扣下板機, 再靶紙上留下一個洞, 沒錯, 就只有一個。還有一點, 真正在打靶的時候, 你是看不到紅心的 (如果知道紅心在那裡就不需要估計了), 所以你只能從打紙上僅有的一個點, 來推測紅心的位置, 因此這把槍的精度不能太低, 否則以右下角的圖為例, 在紙上只有一個黑點的情況下, 你完全無法想像紅心在哪個位置。(但這不代表槍的準度可以很差, 想想左下角的圖, 以這把槍而言, 你應該會猜測紅心在那團黑黑的地方附近吧!) 至於彈孔的分散程度如何? 我們可以用標準差來衡量。


估計一個區間, 而非一個點

還記得之前上課時老師給過一個很生動的比喻, 如果點估計是拿魚叉來捕魚, 但你發現自己抓不太到魚的話該怎麼辦呢? 答案是改拿網子來撈。在統計學上, 我們的做法會是這樣: 算出平均數, 往下減1.96個標準差, 往上加1.96個標準差, 就可以做出一個區間, 這個區間涵蓋到紅心的機率就會有95%。所謂的區間其實大家非常熟悉, 一定每個人都有看過, 只是你可能不知道自己看了什麼。舉個例子, 天氣預報, 當颱風來臨時, 我們看到氣象局給出來的路徑預測圖, 氣象局都不會只畫出中間那條線, 而是會再往外擴大範圍, 如下圖所示

raw-image

這個做法是怎麼來的呢? 大家應該都有聽過, 常態分配正中間是平均值, 往外加減一個標準差可以涵蓋68.27%的人, 往外加減兩個標準差可以涵蓋95.45%, 往外加減三個標準差就可以涵蓋到99.73%, 這就是所謂的三西格馬法則。既然樣本平均數落在母體平均數加減2個標準差的機率是95.45%, 那麼反過來說, 我們只要將樣本平均數加減2個標準差, 我們涵蓋到母體平均數的機率就會有95.45%。


目前為止, 我們有兩個問題需要被解決,

1.從製作區間的時候, 我們用的是1.96個標準差, 但三西馬格法則中, 卻是加減2個標準差?

2.為什麼是常態分配呢? 還有一定是常態分配嗎?

第一個問題比較簡單, 因為在三西格馬法則中我們是站在方便大家計算的角度來看的, 而在做研究報告時, 大家 “約定成俗” 可以接受的誤差分別是10%, 5%, 1%, 我們會抓取95%來做區間, 95%相較於95.45%低一點點, 因此區間會窄一點, 所以會用1.96個標準差, 而非兩個。(註: 其實在學術界上, 多少誤差可以接受的多少是怎麼決定的呢? 答案是之前的人用多少就用多少。因此, 可以接受的誤差是10%, 5% 和1% 三種, 其中又以5% 最常見, 大家常用的p-value小於0.05也是同樣的概念, 之後有機會再寫一篇來說明p-value。)

至於第二個問題要說明清楚除了需要一點理論基礎外, 也涉及到一點數學計算,  有興趣的朋友歡迎來信詢問。


事前、事後

許多人會在計算出區間後, 寫下這樣的敘述:

母體平均數落在 (0.3, 0.5) 之間的機率是95% 

這樣的說法是有瑕疵的, 雖然我們不知道母體平均數是多少, 但他是存在的一個數, 只是我們不知道他是多少而已, 因此當你抽樣完, 算出區間是0.3到0.5的時候, 母體平均數落在這個區間的機率不是0就是1, 只是我們不知道是哪個。那我們該怎麼解釋這個結果呢? 我們會說: 我有95%的 ”信心”, 這個區間會涵蓋到母體平均數, 因此區間估計又被稱作信賴區間。這就好比, 今天你跟另一半在滾床單前, 讓對方吃下了事前避孕藥, 這時候你可以說這個藥可以成功避孕的機率有95%, 但一陣大汗淋漓, 翻雲覆雨後, 你射進了對方的身體裡, 這時候就有中就有中, 沒中就沒中, 沒有什麼95%的機率了, 但你可以說因為有吃事前, 所以你有95%的信心這次不會懷孕。提醒: 就像前幾篇文章中說的, 在做決策前, 我們應該想的是萬一中了我能不能承擔, 代價有多大, 而不是自己很有信心, 然後全部都交給機率, 聽天由命。


會特別把事前事後拿出來談是因為很多大學學生在做解釋時, 總是使用前面我們特別highlight起來的錯誤敘述, 讓大學教授很苦惱 (我至少聽過3個不同的老師抱怨這件事)。其實這段在高中數學裡是有提到的, 只是相較於大學, 高中時期對於結果的解釋相對沒那麼注重, 因此當初沒有注意到細節的朋友, 升上大學後就會讓教授感覺到非常困擾。

小結

相較於之前的文章, 我們將資料的分散程度考慮進來, 並介紹了一種可以同時考慮兩個資訊的統計學工具 (在做區間估計時, 我們同時使用了平均數和標準差), 希望大家以後看到報導底下網友為了平均數或中為數是多少吵得不可開交時, 冷靜想想除了發文跟吵架者的目的外, 是不是因為給出來的資訊太少了, 才會讓大家吵成這樣。

留言
avatar-img
留言分享你的想法!
avatar-img
MC 統計的沙龍
2會員
8內容數
MC 統計的沙龍的其他內容
2023/08/06
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
2023/08/06
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
2023/07/30
今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。
Thumbnail
2023/07/30
今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。
Thumbnail
2023/07/23
Essentially, all models are wrong, but some are useful. 既然模型都是錯的,那我們還學這些要幹嘛呢?
Thumbnail
2023/07/23
Essentially, all models are wrong, but some are useful. 既然模型都是錯的,那我們還學這些要幹嘛呢?
Thumbnail
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。
Thumbnail
上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
2022/5/6,耿鼎(1524),今天這個盤型,與常見量能模組(二)相當類似,是非常容易讓人誤會的盤型,就連血哥今天也上當受騙了,事後看才發現漏看了這些小細節,在這邊分享給各位學員,希望大家以後遇到這種走勢,要能夠注意以下這三個重點!
Thumbnail
2022/5/6,耿鼎(1524),今天這個盤型,與常見量能模組(二)相當類似,是非常容易讓人誤會的盤型,就連血哥今天也上當受騙了,事後看才發現漏看了這些小細節,在這邊分享給各位學員,希望大家以後遇到這種走勢,要能夠注意以下這三個重點!
Thumbnail
本文章收集與評論三個體現「精準度-可解釋性權衡 (Accuracy-Interpretability Tradeoff)」的例子。 在詐欺偵測的數據集中,本來預期要觀察到的權衡,似乎並沒有出現。這令人非常好奇這個權衡的故事,源頭是哪邊。 本文章收錄三個,對於此權衡的認知升級。
Thumbnail
本文章收集與評論三個體現「精準度-可解釋性權衡 (Accuracy-Interpretability Tradeoff)」的例子。 在詐欺偵測的數據集中,本來預期要觀察到的權衡,似乎並沒有出現。這令人非常好奇這個權衡的故事,源頭是哪邊。 本文章收錄三個,對於此權衡的認知升級。
Thumbnail
很多時候我們會聽到,現在股價高檔要留意下修的風險或現在的股價在低檔可以開始進行布局,這時你心中一定會想,股價的高檔或是低檔這些位階,是如何判斷的?這次我將告訴你,我如何透過『相對位階估價法』評估股價的位階,同時我也會告訴你這種『相對位階估價法』的缺點,避免你陷入投資方法的誤區。
Thumbnail
很多時候我們會聽到,現在股價高檔要留意下修的風險或現在的股價在低檔可以開始進行布局,這時你心中一定會想,股價的高檔或是低檔這些位階,是如何判斷的?這次我將告訴你,我如何透過『相對位階估價法』評估股價的位階,同時我也會告訴你這種『相對位階估價法』的缺點,避免你陷入投資方法的誤區。
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
點估計(point estimation)是指用樣本資料來估計母體參數,使用一個點的數值表示其估計值,因此稱為點估計。事實上我們相當常見的樣本平均數或樣本變異數就是點估計,我們是使用樣本資料計算出一個數值,然後再用這個點的數值去估計母體的參數。
Thumbnail
點估計(point estimation)是指用樣本資料來估計母體參數,使用一個點的數值表示其估計值,因此稱為點估計。事實上我們相當常見的樣本平均數或樣本變異數就是點估計,我們是使用樣本資料計算出一個數值,然後再用這個點的數值去估計母體的參數。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News