區間估計

更新於 發佈於 閱讀時間約 5 分鐘

上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。

準度、精度

raw-image

上圖是四次打靶的結果, 做估計就很像在打靶, 左上角的結果看起來大部分都落在紅心上, 這就是我們最想看到的結果, 右上角的圖平均而言有落在紅心上, 但每次出手的結果似乎沒有那麼一致, 左下角的圖則是出手結果很一致, 但平均而言他打歪了, 右下角的圖則是最糟糕的結果, 大家都不樂見。

所謂的平均而言有打中, 我們稱之為準度, 而每次出手的結果接不接近, 我們稱之為精度。為什麼我們一直在強調精度的重要呢? 因為真的去蒐集數據, 算出一個平均數, 就很像是你拿起槍, 深呼吸, 屏氣凝神, 一直到扣下板機, 再靶紙上留下一個洞, 沒錯, 就只有一個。還有一點, 真正在打靶的時候, 你是看不到紅心的 (如果知道紅心在那裡就不需要估計了), 所以你只能從打紙上僅有的一個點, 來推測紅心的位置, 因此這把槍的精度不能太低, 否則以右下角的圖為例, 在紙上只有一個黑點的情況下, 你完全無法想像紅心在哪個位置。(但這不代表槍的準度可以很差, 想想左下角的圖, 以這把槍而言, 你應該會猜測紅心在那團黑黑的地方附近吧!) 至於彈孔的分散程度如何? 我們可以用標準差來衡量。


估計一個區間, 而非一個點

還記得之前上課時老師給過一個很生動的比喻, 如果點估計是拿魚叉來捕魚, 但你發現自己抓不太到魚的話該怎麼辦呢? 答案是改拿網子來撈。在統計學上, 我們的做法會是這樣: 算出平均數, 往下減1.96個標準差, 往上加1.96個標準差, 就可以做出一個區間, 這個區間涵蓋到紅心的機率就會有95%。所謂的區間其實大家非常熟悉, 一定每個人都有看過, 只是你可能不知道自己看了什麼。舉個例子, 天氣預報, 當颱風來臨時, 我們看到氣象局給出來的路徑預測圖, 氣象局都不會只畫出中間那條線, 而是會再往外擴大範圍, 如下圖所示

raw-image

這個做法是怎麼來的呢? 大家應該都有聽過, 常態分配正中間是平均值, 往外加減一個標準差可以涵蓋68.27%的人, 往外加減兩個標準差可以涵蓋95.45%, 往外加減三個標準差就可以涵蓋到99.73%, 這就是所謂的三西格馬法則。既然樣本平均數落在母體平均數加減2個標準差的機率是95.45%, 那麼反過來說, 我們只要將樣本平均數加減2個標準差, 我們涵蓋到母體平均數的機率就會有95.45%。


目前為止, 我們有兩個問題需要被解決,

1.從製作區間的時候, 我們用的是1.96個標準差, 但三西馬格法則中, 卻是加減2個標準差?

2.為什麼是常態分配呢? 還有一定是常態分配嗎?

第一個問題比較簡單, 因為在三西格馬法則中我們是站在方便大家計算的角度來看的, 而在做研究報告時, 大家 “約定成俗” 可以接受的誤差分別是10%, 5%, 1%, 我們會抓取95%來做區間, 95%相較於95.45%低一點點, 因此區間會窄一點, 所以會用1.96個標準差, 而非兩個。(註: 其實在學術界上, 多少誤差可以接受的多少是怎麼決定的呢? 答案是之前的人用多少就用多少。因此, 可以接受的誤差是10%, 5% 和1% 三種, 其中又以5% 最常見, 大家常用的p-value小於0.05也是同樣的概念, 之後有機會再寫一篇來說明p-value。)

至於第二個問題要說明清楚除了需要一點理論基礎外, 也涉及到一點數學計算,  有興趣的朋友歡迎來信詢問。


事前、事後

許多人會在計算出區間後, 寫下這樣的敘述:

母體平均數落在 (0.3, 0.5) 之間的機率是95% 

這樣的說法是有瑕疵的, 雖然我們不知道母體平均數是多少, 但他是存在的一個數, 只是我們不知道他是多少而已, 因此當你抽樣完, 算出區間是0.3到0.5的時候, 母體平均數落在這個區間的機率不是0就是1, 只是我們不知道是哪個。那我們該怎麼解釋這個結果呢? 我們會說: 我有95%的 ”信心”, 這個區間會涵蓋到母體平均數, 因此區間估計又被稱作信賴區間。這就好比, 今天你跟另一半在滾床單前, 讓對方吃下了事前避孕藥, 這時候你可以說這個藥可以成功避孕的機率有95%, 但一陣大汗淋漓, 翻雲覆雨後, 你射進了對方的身體裡, 這時候就有中就有中, 沒中就沒中, 沒有什麼95%的機率了, 但你可以說因為有吃事前, 所以你有95%的信心這次不會懷孕。提醒: 就像前幾篇文章中說的, 在做決策前, 我們應該想的是萬一中了我能不能承擔, 代價有多大, 而不是自己很有信心, 然後全部都交給機率, 聽天由命。


會特別把事前事後拿出來談是因為很多大學學生在做解釋時, 總是使用前面我們特別highlight起來的錯誤敘述, 讓大學教授很苦惱 (我至少聽過3個不同的老師抱怨這件事)。其實這段在高中數學裡是有提到的, 只是相較於大學, 高中時期對於結果的解釋相對沒那麼注重, 因此當初沒有注意到細節的朋友, 升上大學後就會讓教授感覺到非常困擾。

小結

相較於之前的文章, 我們將資料的分散程度考慮進來, 並介紹了一種可以同時考慮兩個資訊的統計學工具 (在做區間估計時, 我們同時使用了平均數和標準差), 希望大家以後看到報導底下網友為了平均數或中為數是多少吵得不可開交時, 冷靜想想除了發文跟吵架者的目的外, 是不是因為給出來的資訊太少了, 才會讓大家吵成這樣。

avatar-img
2會員
8內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
MC 統計的沙龍 的其他內容
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
除了「夠好」經驗法則和避免最壞結果的決策模式外,作者也特別強調機率和自然頻率的觀念。 我們在前面討論蒙提霍爾問題時已經稍微接觸過,接下來我們繼續進行更深入的探討。以下是作者舉的一個例子: 女性罹患乳癌的盛行機率是1%。 如果一名婦女有乳癌,那麼她檢驗為陽性的機率是90%。 倘若一名婦女沒有乳
本篇文章介紹了一種簡單但正確的評估方法,以投資評估總分和本益比為依據,給出了公司的投資評級,並以臺積電和NVDA作為範例。文章還提到了演算法的重要性,以及執行長數學的思路。建議投資者試用這種投資策略來輔助自己的投資。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
說明目標式社會計量的目標、一般性運用原則、延伸與提醒、問句舉例。
什麼叫均值回歸,要如何搭配股市操作,可以參考作者的方法。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
當你說出樂觀與保守的估計值後,一定有人會問落在這個範圍的機率為何?這時你可以根據過去統計資料來推算發生機率,沒有資料就用你自己的方法來推算發生的機率。 比如說:「 預估範為 200~500 萬,機率 90%,因為...,除此之外超出 500 萬機率是 8 %,低於 200 萬是 2 %。 」
劉潤 第一章 定準方向 成為高手: 1.判斷力:最少的資訊,判斷力正確。 2.分寸感:複雜性的對沖,簡單說明整局判斷。該給的與不該給的如何取捨,大家利益極大化。 3.顆粒度:大而無外,小而無內。 複雜事情簡單化: 1.目標與指標:指標是用來衡量目標達成的一種量化。 2.回歸本質:第一
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
除了「夠好」經驗法則和避免最壞結果的決策模式外,作者也特別強調機率和自然頻率的觀念。 我們在前面討論蒙提霍爾問題時已經稍微接觸過,接下來我們繼續進行更深入的探討。以下是作者舉的一個例子: 女性罹患乳癌的盛行機率是1%。 如果一名婦女有乳癌,那麼她檢驗為陽性的機率是90%。 倘若一名婦女沒有乳
本篇文章介紹了一種簡單但正確的評估方法,以投資評估總分和本益比為依據,給出了公司的投資評級,並以臺積電和NVDA作為範例。文章還提到了演算法的重要性,以及執行長數學的思路。建議投資者試用這種投資策略來輔助自己的投資。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
說明目標式社會計量的目標、一般性運用原則、延伸與提醒、問句舉例。
什麼叫均值回歸,要如何搭配股市操作,可以參考作者的方法。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
當你說出樂觀與保守的估計值後,一定有人會問落在這個範圍的機率為何?這時你可以根據過去統計資料來推算發生機率,沒有資料就用你自己的方法來推算發生的機率。 比如說:「 預估範為 200~500 萬,機率 90%,因為...,除此之外超出 500 萬機率是 8 %,低於 200 萬是 2 %。 」
劉潤 第一章 定準方向 成為高手: 1.判斷力:最少的資訊,判斷力正確。 2.分寸感:複雜性的對沖,簡單說明整局判斷。該給的與不該給的如何取捨,大家利益極大化。 3.顆粒度:大而無外,小而無內。 複雜事情簡單化: 1.目標與指標:指標是用來衡量目標達成的一種量化。 2.回歸本質:第一
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。