區間估計

閱讀時間約 5 分鐘

上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。

準度、精度

raw-image

上圖是四次打靶的結果, 做估計就很像在打靶, 左上角的結果看起來大部分都落在紅心上, 這就是我們最想看到的結果, 右上角的圖平均而言有落在紅心上, 但每次出手的結果似乎沒有那麼一致, 左下角的圖則是出手結果很一致, 但平均而言他打歪了, 右下角的圖則是最糟糕的結果, 大家都不樂見。

所謂的平均而言有打中, 我們稱之為準度, 而每次出手的結果接不接近, 我們稱之為精度。為什麼我們一直在強調精度的重要呢? 因為真的去蒐集數據, 算出一個平均數, 就很像是你拿起槍, 深呼吸, 屏氣凝神, 一直到扣下板機, 再靶紙上留下一個洞, 沒錯, 就只有一個。還有一點, 真正在打靶的時候, 你是看不到紅心的 (如果知道紅心在那裡就不需要估計了), 所以你只能從打紙上僅有的一個點, 來推測紅心的位置, 因此這把槍的精度不能太低, 否則以右下角的圖為例, 在紙上只有一個黑點的情況下, 你完全無法想像紅心在哪個位置。(但這不代表槍的準度可以很差, 想想左下角的圖, 以這把槍而言, 你應該會猜測紅心在那團黑黑的地方附近吧!) 至於彈孔的分散程度如何? 我們可以用標準差來衡量。


估計一個區間, 而非一個點

還記得之前上課時老師給過一個很生動的比喻, 如果點估計是拿魚叉來捕魚, 但你發現自己抓不太到魚的話該怎麼辦呢? 答案是改拿網子來撈。在統計學上, 我們的做法會是這樣: 算出平均數, 往下減1.96個標準差, 往上加1.96個標準差, 就可以做出一個區間, 這個區間涵蓋到紅心的機率就會有95%。所謂的區間其實大家非常熟悉, 一定每個人都有看過, 只是你可能不知道自己看了什麼。舉個例子, 天氣預報, 當颱風來臨時, 我們看到氣象局給出來的路徑預測圖, 氣象局都不會只畫出中間那條線, 而是會再往外擴大範圍, 如下圖所示

raw-image

這個做法是怎麼來的呢? 大家應該都有聽過, 常態分配正中間是平均值, 往外加減一個標準差可以涵蓋68.27%的人, 往外加減兩個標準差可以涵蓋95.45%, 往外加減三個標準差就可以涵蓋到99.73%, 這就是所謂的三西格馬法則。既然樣本平均數落在母體平均數加減2個標準差的機率是95.45%, 那麼反過來說, 我們只要將樣本平均數加減2個標準差, 我們涵蓋到母體平均數的機率就會有95.45%。


目前為止, 我們有兩個問題需要被解決,

1.從製作區間的時候, 我們用的是1.96個標準差, 但三西馬格法則中, 卻是加減2個標準差?

2.為什麼是常態分配呢? 還有一定是常態分配嗎?

第一個問題比較簡單, 因為在三西格馬法則中我們是站在方便大家計算的角度來看的, 而在做研究報告時, 大家 “約定成俗” 可以接受的誤差分別是10%, 5%, 1%, 我們會抓取95%來做區間, 95%相較於95.45%低一點點, 因此區間會窄一點, 所以會用1.96個標準差, 而非兩個。(註: 其實在學術界上, 多少誤差可以接受的多少是怎麼決定的呢? 答案是之前的人用多少就用多少。因此, 可以接受的誤差是10%, 5% 和1% 三種, 其中又以5% 最常見, 大家常用的p-value小於0.05也是同樣的概念, 之後有機會再寫一篇來說明p-value。)

至於第二個問題要說明清楚除了需要一點理論基礎外, 也涉及到一點數學計算,  有興趣的朋友歡迎來信詢問。


事前、事後

許多人會在計算出區間後, 寫下這樣的敘述:

母體平均數落在 (0.3, 0.5) 之間的機率是95% 

這樣的說法是有瑕疵的, 雖然我們不知道母體平均數是多少, 但他是存在的一個數, 只是我們不知道他是多少而已, 因此當你抽樣完, 算出區間是0.3到0.5的時候, 母體平均數落在這個區間的機率不是0就是1, 只是我們不知道是哪個。那我們該怎麼解釋這個結果呢? 我們會說: 我有95%的 ”信心”, 這個區間會涵蓋到母體平均數, 因此區間估計又被稱作信賴區間。這就好比, 今天你跟另一半在滾床單前, 讓對方吃下了事前避孕藥, 這時候你可以說這個藥可以成功避孕的機率有95%, 但一陣大汗淋漓, 翻雲覆雨後, 你射進了對方的身體裡, 這時候就有中就有中, 沒中就沒中, 沒有什麼95%的機率了, 但你可以說因為有吃事前, 所以你有95%的信心這次不會懷孕。提醒: 就像前幾篇文章中說的, 在做決策前, 我們應該想的是萬一中了我能不能承擔, 代價有多大, 而不是自己很有信心, 然後全部都交給機率, 聽天由命。


會特別把事前事後拿出來談是因為很多大學學生在做解釋時, 總是使用前面我們特別highlight起來的錯誤敘述, 讓大學教授很苦惱 (我至少聽過3個不同的老師抱怨這件事)。其實這段在高中數學裡是有提到的, 只是相較於大學, 高中時期對於結果的解釋相對沒那麼注重, 因此當初沒有注意到細節的朋友, 升上大學後就會讓教授感覺到非常困擾。

小結

相較於之前的文章, 我們將資料的分散程度考慮進來, 並介紹了一種可以同時考慮兩個資訊的統計學工具 (在做區間估計時, 我們同時使用了平均數和標準差), 希望大家以後看到報導底下網友為了平均數或中為數是多少吵得不可開交時, 冷靜想想除了發文跟吵架者的目的外, 是不是因為給出來的資訊太少了, 才會讓大家吵成這樣。

2會員
8內容數
留言0
查看全部
發表第一個留言支持創作者!
MC 統計的沙龍 的其他內容
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?
在徐志摩《西湖記》中, 描述了事物因為數量夠大, 所呈現的排列、規律、節奏之美。然而, 數大可不是只有美, 還能有許多妙用!
在上一篇中提到當我們面臨選擇時, 可以從期望值的角度, 思考自己的決策, 但這時候會碰到一個問題, 就是你的決策會趨向保守, 雖然能約束你不要做壞事, 但也可能害你錯失許多機會。該如何改善這樣的困境呢? 讓我們繼續看下去。
什麼是機率? 什麼是期望值? 這些跟我們的人生又有什麼關係呢?
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
加拿大卡加立市立圖書館由挪威與美國合資的建築團隊Snøhetta與加拿大的DIALOG事務所聯手設計,圖書館從2013為期五年的設計翻修計劃,是1988年冬季奧運之後,卡加立投資最大的公共計劃,2019年更被《時代》雜誌列入世界最偉大地標之一,被建築設計媒體Architectural
Thumbnail
第一金,股票代號:2892,以銀行為主體的公股金控,前 7 個月 EPS 累計 0.97,同期累計成長:-3.96%。 整體概況:七月份營收:73.22億元,七月份營收成長率:32.41%,本益比:17.7,預估本益比:15.8。 營收預期全年度 EPS 為: 以下提供四種思維給不同投資人:
Thumbnail
中信金,股票代號:2891,銀行壽險雙獲利引擎的民營金控公司,前 7 個月 EPS 累計 1.53,同期累計成長:-17.30%。 整體概況: 上個月 0.1,七月份 0.29,其主要原因就是...點選內文
Thumbnail
富邦金,股票代號:2881,台灣目前資產規模前兩大的金控之一,前 7 個月 EPS 累計6.81,同期累計成長:-32.57%。 整體概況: 7月份營收:233.87億元,7月份營收成長率:-31.94%,本益比:5.7,預估本益比:7.2,銀行部分賺錢,證券、產險以及人壽部分呈現年減。
Thumbnail
玉山金,股票代號:2884,以銀行為主體的金控,跨足票券、證券業務,,前 7 個月 EPS 累計 0.74,同期累計成長:-26.00%。 整體概況: 營收預期: 佈局的方式: 有問題可私訊:
Thumbnail
新光金,股票代號:2888,旗下新光人壽為台灣前五大保險公司,前 7 個月 EPS 累計 0.25,同期累計成長:-80.47%。 整體概況: 營收預期: 以下提供四種思維給不同佈局週期的投資人來參考:
Thumbnail
開發金股票代號:2883,開發金鄉民暱稱:我開發大金控,前 7 個月 EPS 累計 1,同期累計成長 -22.32%。 整體概況:開發金 7 月稅後獲利 31.75 億元、前 7 月獲利 167.93 億元每股盈餘為 1.0 元,單月 0.19 的我開發大金控。
Thumbnail
5月31日,歐盟統計局公佈了初步估計的歐元區5月通脹數據。歐元區本月消費者價格指數同比上漲8.1%,繼4月該指數同比上漲7.4%之後,再次刷新歐元區成立以來的歷史紀錄,也超出了此前外界預測的7.7%。 由於各國本身能源價格的迥異以及對國際能源依賴程度的不同,各國的通脹數據大相徑庭。
Thumbnail
這間位在東門市場的傳統豆花店也是這裡的人氣名店,沒有很花俏的配料也沒有華麗的裝飾,就是一碗簡樸帶有濃厚古早味的豆花,不管在豆花、花生、糖水與冰涼度,一切都是那麼的剛剛好, 吃過一次就讓人難忘,難怪在這裡始終屹立不搖~
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
加拿大卡加立市立圖書館由挪威與美國合資的建築團隊Snøhetta與加拿大的DIALOG事務所聯手設計,圖書館從2013為期五年的設計翻修計劃,是1988年冬季奧運之後,卡加立投資最大的公共計劃,2019年更被《時代》雜誌列入世界最偉大地標之一,被建築設計媒體Architectural
Thumbnail
第一金,股票代號:2892,以銀行為主體的公股金控,前 7 個月 EPS 累計 0.97,同期累計成長:-3.96%。 整體概況:七月份營收:73.22億元,七月份營收成長率:32.41%,本益比:17.7,預估本益比:15.8。 營收預期全年度 EPS 為: 以下提供四種思維給不同投資人:
Thumbnail
中信金,股票代號:2891,銀行壽險雙獲利引擎的民營金控公司,前 7 個月 EPS 累計 1.53,同期累計成長:-17.30%。 整體概況: 上個月 0.1,七月份 0.29,其主要原因就是...點選內文
Thumbnail
富邦金,股票代號:2881,台灣目前資產規模前兩大的金控之一,前 7 個月 EPS 累計6.81,同期累計成長:-32.57%。 整體概況: 7月份營收:233.87億元,7月份營收成長率:-31.94%,本益比:5.7,預估本益比:7.2,銀行部分賺錢,證券、產險以及人壽部分呈現年減。
Thumbnail
玉山金,股票代號:2884,以銀行為主體的金控,跨足票券、證券業務,,前 7 個月 EPS 累計 0.74,同期累計成長:-26.00%。 整體概況: 營收預期: 佈局的方式: 有問題可私訊:
Thumbnail
新光金,股票代號:2888,旗下新光人壽為台灣前五大保險公司,前 7 個月 EPS 累計 0.25,同期累計成長:-80.47%。 整體概況: 營收預期: 以下提供四種思維給不同佈局週期的投資人來參考:
Thumbnail
開發金股票代號:2883,開發金鄉民暱稱:我開發大金控,前 7 個月 EPS 累計 1,同期累計成長 -22.32%。 整體概況:開發金 7 月稅後獲利 31.75 億元、前 7 月獲利 167.93 億元每股盈餘為 1.0 元,單月 0.19 的我開發大金控。
Thumbnail
5月31日,歐盟統計局公佈了初步估計的歐元區5月通脹數據。歐元區本月消費者價格指數同比上漲8.1%,繼4月該指數同比上漲7.4%之後,再次刷新歐元區成立以來的歷史紀錄,也超出了此前外界預測的7.7%。 由於各國本身能源價格的迥異以及對國際能源依賴程度的不同,各國的通脹數據大相徑庭。
Thumbnail
這間位在東門市場的傳統豆花店也是這裡的人氣名店,沒有很花俏的配料也沒有華麗的裝飾,就是一碗簡樸帶有濃厚古早味的豆花,不管在豆花、花生、糖水與冰涼度,一切都是那麼的剛剛好, 吃過一次就讓人難忘,難怪在這裡始終屹立不搖~