統計新知:手上有母體資料,還需不需要考慮統計檢定來做決定?

更新 發佈閱讀 7 分鐘
示意圖,由Gemini所製

示意圖,由Gemini所製


今天要談的是有點哲學的東西,就是何為不確定性。統計檢定相當重要。科學研究依賴統計檢查來理解一些大道理,像制度是否影響了經濟發展。制藥的實驗室依賴統計檢定來確認新藥是否有效。統計檢查也悠關大買賣。筆者認識的華爾街對沖基金,如果有用到統計模型,通常真的會做假說檢定才決定是否下單。換句話說,若測量出現誤差,可能會得到相當錯誤的決策。

而今天就是來談測量不確定性的兩個主流,也就是所謂的design-based vs sample-based uncertainty,或中文可稱「研究設計為準的不確定性」與「抽樣不確定性」。

在大數據盛行的今天,如果我手上有母體資料,還需不需要考慮統計檢定?

在臺灣的話,大部份在教統計檢定或標準誤,都還是站在抽樣為主的大樣本的觀點:假設有一個無限大的母體,然後抽出有限個樣本,但對於社科研究來說,這角度常常很odd,比方說我手上有母體資料,那為何跑迴歸分析時還要做inference?

這問題其實Manski and Pepper (2018)幾年前寫文章時就有抱怨過,Manski的抱怨如下:假如你有美國五十個州跑迴歸,你基本上母體了,該如何詮釋標準誤呢?我們必須要有標準誤,才能進行統計推論,沒有統計推論,怎無法進行假說檢定,所以標準誤的意義跟計算,哪是科學方法的重中之重。


不過這幾年大家慢慢把這講清楚了,特別是計量學家的All-star team寫的這篇文章"Sampling‐based versus design‐based uncertainty in regression analysis",發表在Econometrica上,作者包括了Alberto Abadie、諾獎得主Guido Imbens 、Susan Athey跟Jeffrey Wooldridge,這篇文章在這幾年的哈佛計量讀書會都一再提到。


這篇文章的計量複雜,但我們不妨從比較哲學的觀點來看。我們怎麼認識不確定性?

不確定性本來就不只一種哲學,傳統上的抽樣的隨機性是一個來源。但如果我們在做因果推論時,還有進一步去思考平行世界下的counterfactual,而平行世界這東西你永遠都是看不到的,就算假設counterfactual本身是固定的(白話文:平行宇宙的創造本身沒有不確定性),仍存在了另一種實驗設計或政策設計造成的隨機性:誰被分配到控制組跟對照組本身是有一定的不確定性。

事實上,計量經濟學還存在另外兩種常見的不確定性,也可以貢獻於標準誤,一個是「測量誤差」,常見於Teacher Value-Added或是CEO Value-Added的研究,另一種則是「研究客體知道的資訊比研究者為多」,則常見於動差不等式(Moment Inequality)相關的研究。


因此,就算你有母體資料,你想要理解因果推論,無論這政策本身是一個人為實驗還是自然實驗,如果你相信你的政策在「誰會被選為控制組/對照組」這回事有一定的隨機性的話,你仍然需要計算標準誤、並以標準誤進行統計檢定,只是你要進行的是design-based inference,

當然,要怎麼做「design-based inference」,就是另外一個當紅的計量話題了,很多哲學的東西,要回頭Fisher跟Neyman當年的爭論去,但整個邏輯跟傳統的「抽樣」為基礎的理解,就相當不一樣。

首先,推論的起點就往往不是假設一個無限大的母體了,還是先假設一個有限的資料開始,回頭去談「有限資料下的大樣本」,也因而有了一個從sample-based的觀點來看會有點奇妙的「有限樣本的大樣本推論」。

這觀點的轉換很重要,因為就算你不是持有母體資料,有些東西還是比較容易從design-based inference的去想,比方說社會網絡分析。雖然很多可以操作的網絡理論都可以用Large-sample network theory去把很多網路統計量寫出來(像graph homeomorphism),但實證上你去思考大樣本逼近的時候,如果用sample-based的觀點,就會變成要用小的子圖越變越大去逼近母圖,實證的論理會變得有點怪,因為在你原本的分析中,可能沒有存在對於你手上的子圖跟母圖的關係好的解釋(Large-sample network theory其實通常假設你手上有母圖,但母圖太複雜,所以你抽子圖來解釋母圖。跟你資料只有抽樣出的子圖來逼近母體是兩回事)

所以像一些最新做網絡研究的統計推論,就會用design-based inference去看,那對於不確定性的想法就變得簡單的:哪怕社會網絡再複雜,但我在這裡討論的不確定性不是網絡本身變大變小,而是給定一個網絡,哪些地方會被政策影響到有一定隨機性。

不過,假設我手上有母體,而且我政策分配沒有不確定性,那是不是還要統計推論呢?事實上可以證明,在一些條件底下,那種情況下寫出來的標準誤會剛好等於0,也就是你的敘述統計已經講完了你要講的,這也是某些美國Opportunity Insight的美國母體資料的情況。(不過,換言之,「我不需要做統計推論」必須要有很強的條件。)

然而,經濟研究的現況往往更為複雜,一個迴歸分析可能同時涉入了不只一種的不確定性,那又該如何推論呢?特別是,除了上述的「四種」不確定性(抽樣、設計、測量誤差、研究客體與研究者間的資訊不對稱),其實還存在第五種,就是經濟模型均衡下(比方說一般均衡)底下的「加總」所導致的不確定性。有興趣的讀者可以參考Jinyong Hahn , Guido Kuersteiner , Maurizio Mazzocco的研究"Estimation with Aggregate Shocks"。

總結來說,研究者必須要想清楚「自己的目的」,並考慮「資料的性質」,進一步構思手上的「研究設計」,與說明背後隱含的「行為模型」,這些格子都打勾了,你才能真的知道自己要怎麼進行正確的統計假說驗證,因為背後隱含的大樣本理論甚至可能相當不一樣,這也是筆者之前在哈佛博士班一年時下學期的計量資格考的一個重要考點就是了。

諸君,你已經覺得夠玄了?事實上在「資產定價模型」,還存在某些東西可能導致類似「負機率」的情況發生(not joking),下回再分曉。






留言
avatar-img
哈佛學記:鄭紹鈺的寫作空間
6.0K會員
171內容數
鄭紹鈺,臺大外文系,臺大經研所,哈佛大學經濟系博士班。這裡是我的寫作空間。
2025/12/07
筆者在哈佛商學院上課時,上到了「家戶金融」這一塊時,老師教了這一篇相當有意思的文章:The Wealthy Hand-to-Mouth,在英文裡Live from Hand to Mouth是指月光族的意思,但為何是「有錢的月光族」呢? 這篇研究提出了一種相當有意思的觀點:在西方國家的月光族,
Thumbnail
2025/12/07
筆者在哈佛商學院上課時,上到了「家戶金融」這一塊時,老師教了這一篇相當有意思的文章:The Wealthy Hand-to-Mouth,在英文裡Live from Hand to Mouth是指月光族的意思,但為何是「有錢的月光族」呢? 這篇研究提出了一種相當有意思的觀點:在西方國家的月光族,
Thumbnail
2025/12/06
眾所皆知,歐洲針對高所得的稅率動不動高達50%: 而法國便是當中前幾名的,超過50%。而今天法國又打算再高Corporate Tax,大企業稅率可以加高到40%,而路易威登的企業主Bernard Arnault威脅考慮外移。 事實上不只是最大企業,過去幾年,已經有不少法國的企業選擇外移到美國,早
Thumbnail
2025/12/06
眾所皆知,歐洲針對高所得的稅率動不動高達50%: 而法國便是當中前幾名的,超過50%。而今天法國又打算再高Corporate Tax,大企業稅率可以加高到40%,而路易威登的企業主Bernard Arnault威脅考慮外移。 事實上不只是最大企業,過去幾年,已經有不少法國的企業選擇外移到美國,早
Thumbnail
2025/12/01
我有次在線上研討會上講廣納性金融的重要性,現場一名中國經濟學家聽了很激動,情緒就起來了,非常生氣,堅持廣納性制度對經濟不重要---你看,中國金融再怎麼榨取,國家還不是起飛?經濟成長哪年沒有保六?你有什麼資格說經濟成長一定要廣納那一套?金融為什麼要普惠? 可是,君不見現在這些地方銀行的狀況,
Thumbnail
2025/12/01
我有次在線上研討會上講廣納性金融的重要性,現場一名中國經濟學家聽了很激動,情緒就起來了,非常生氣,堅持廣納性制度對經濟不重要---你看,中國金融再怎麼榨取,國家還不是起飛?經濟成長哪年沒有保六?你有什麼資格說經濟成長一定要廣納那一套?金融為什麼要普惠? 可是,君不見現在這些地方銀行的狀況,
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
在上一篇文章中,我們一起漫步於機率分布的世界,認識了像常態分布、二項分布、柏松分布這些基礎卻無比重要的「地標」。它們是統計學的基石,描述了數據世界中最常見的幾種規律。 然而,機率的宇宙浩瀚無垠。有讀者朋友提醒,我們還錯過了許多同樣璀璨的星辰。今天,就讓我們再次啟程,探索另外10個關鍵的機率分布:伽
Thumbnail
在上一篇文章中,我們一起漫步於機率分布的世界,認識了像常態分布、二項分布、柏松分布這些基礎卻無比重要的「地標」。它們是統計學的基石,描述了數據世界中最常見的幾種規律。 然而,機率的宇宙浩瀚無垠。有讀者朋友提醒,我們還錯過了許多同樣璀璨的星辰。今天,就讓我們再次啟程,探索另外10個關鍵的機率分布:伽
Thumbnail
本研究探討大型語言模型 (LLM) 在塔羅牌抽牌任務中的隨機性,以GPT-4o模型進行750次實驗,結果顯示模型抽牌結果並非隨機,而是受提問主題影響,模型更像上下文接續生成器而非隨機數生成器。研究也發現模型本身存在預設偏好,並討論了研究限制與未來研究方向。
Thumbnail
本研究探討大型語言模型 (LLM) 在塔羅牌抽牌任務中的隨機性,以GPT-4o模型進行750次實驗,結果顯示模型抽牌結果並非隨機,而是受提問主題影響,模型更像上下文接續生成器而非隨機數生成器。研究也發現模型本身存在預設偏好,並討論了研究限制與未來研究方向。
Thumbnail
本篇文章提供描述性統計的完整指南,涵蓋集中趨勢、離散趨勢和數據分佈等重要概念,並附上豐富的實務應用案例與 Python 資料視覺化參考連結,協助讀者快速瞭解數據分析的基礎知識。
Thumbnail
本篇文章提供描述性統計的完整指南,涵蓋集中趨勢、離散趨勢和數據分佈等重要概念,並附上豐富的實務應用案例與 Python 資料視覺化參考連結,協助讀者快速瞭解數據分析的基礎知識。
Thumbnail
重抽樣技術是一種強大的統計方法,透過反覆從樣本中取樣,估計統計量的分佈或模型參數的穩健性。本文探討自助法、置換檢驗法和刪一法三種常見方法,並說明其在財務風險管理、模型驗證和決策支持中的應用。雖然重抽樣技術具有許多優勢,但在樣本量極小或存在抽樣偏差時,結果解讀需謹慎。
Thumbnail
重抽樣技術是一種強大的統計方法,透過反覆從樣本中取樣,估計統計量的分佈或模型參數的穩健性。本文探討自助法、置換檢驗法和刪一法三種常見方法,並說明其在財務風險管理、模型驗證和決策支持中的應用。雖然重抽樣技術具有許多優勢,但在樣本量極小或存在抽樣偏差時,結果解讀需謹慎。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News