傾向分數分析:非隨機研究中尋找合適對照組的利器

更新 發佈閱讀 5 分鐘

在實際臨床或觀察性研究中,研究者常面臨一個問題:無法進行隨機分派治療或暴露組,如何在數據中找出一組真正能和案組相匹配、彼此可比的對照組?這時,傾向分數分析(Propensity Score Analysis, PSA)成為一種有效的統計方法,幫助研究者透過數據重現隨機化試驗的效果,降低混淆因子干擾,獲得更準確的因果推論。


傾向分數的定義與目的

傾向分數,是指受試者在給定所有相關共變項條件下,接受某種處置(如治療、暴露)的機率。它彙整了多個混淆變項的信息,能讓你用單一的分數來衡量「個案成為治療組的傾向」。

使用傾向分數分析的核心目的,是在無法隨機分派的情境下,模擬隨機化分組的理想狀態,使「暴露組」和「對照組」在共變項分布上達到平衡。如此一來,研究結果就不會因基線條件差別過大而產生偏誤。 傾向分數分析的黃金四步驟如下


傾向分數分析的黃金四步驟

第一步:建立傾向分數模型

傾向分數分析的第一步是計算每個人的傾向分數,即在給定所有背景特徵的情況下,該個體被分到暴露組的機率。

變數選擇是成敗關鍵:你需要選擇所有可能同時影響「暴露狀態」和「研究結果」的共變項。這些變項應該來自你的資料庫,例如:年齡、性別、種族、BMI、吸菸史、基礎疾病、社經因素等。

模型建構:通常使用羅吉斯迴歸模型,以「是否為個案」作為因變數,所有選定的共變項作為自變數。模型的輸出就是每個人的傾向分數,範圍在0到1之間。

第二步:選擇對照組配對方法

計算出傾向分數後,有幾種主要方法可以創建平衡的比較組:

1. 傾向分數配對

    • 一對一配對:為每個個案找一個傾向分數最接近的對照
    • 一對多配對:在對照組樣本充足時(如你的40萬人資料庫),可為每個個案配對多個對照(如1:2、1:4)
    • 卡尺配對:設定容許範圍(如傾向分數差異不超過0.02),避免匹配質量過差

2. 傾向分數加權

    • 使用逆概率加權方法,為每人賦予權重(個案=1/傾向分數,對照=1/(1-傾向分數))
    • 優點是保留所有樣本,但可能產生極端權重問題

3. 傾向分數分層

    • 將所有人按傾向分數分成5-10層,在每層內比較結果
    • 適合樣本量大的情況

第三步:平衡性檢查

完成配對或加權後,我們必須進行平衡性檢查(Balance Check),確認兩組在所有共變項上是否真的達到了平衡。

    • 檢查方法: 最常用的指標是標準化平均數差異(Standardized Mean Difference, SMD)
      • 連續變數(例如:年齡、BMI)
      raw-image
      XT​:治療組(Treatment group)的平均數XC​:對照組(Control group)的平均數S2T​,S2C​:兩組的變異數👉 這個公式就是「兩組均數差異」除以「合併標準差」。
      • 二元變數 / 類別變數(例如:性別、是否吸菸)
      raw-image
      • PT​:治療組某特徵的比例(例如吸菸者的比例)
      • PC​:對照組的比例
      👉 這裡的分母是「合併後的標準差」,讓比例差異能被標準化。
    • 判斷標準: 一般來說,如果所有共變項的 SMD 都小於 0.1,就代表兩組達到了良好的平衡。
      • ∣SMD∣<0.1 → 平衡良好
      • ∣SMD∣~0.1–0.2 → 輕度不平衡
      • ∣SMD∣>0.2 → 明顯不平衡

如果平衡性不佳,我們可能需要回到第一步,重新調整傾向分數模型,例如加入更多變數或考慮變數間的交互作用。

第四步:最終分析與敏感性測試

平衡性確認後,可進行最終的結果分析。根據採用的方法不同,分析策略也需相應調整:

  • 配對後資料:使用條件式羅吉斯迴歸等考慮配對結構的方法
  • 加權後資料:使用加權迴歸模型,並考慮強健標準誤

傾向分數分析的意義與適用

傾向分數分析不是簡單的抽樣方法,而是一種統計技術,能在觀察性研究中「模擬隨機分配」,大幅降低混淆偏差。它特別適合以下情況:

  • 研究中暴露與對照組沒有隨機分派。
  • 基線共變項眾多且無法輕易直接比較。
  • 個案數相對較少,但有龐大的潛在對照池。

透過傾向分數分析,研究者能選擇出在其他條件一致下,唯一變因為暴露狀態的個體組合,讓觀察性研究的因果推論更為有力與公正。


總結

傾向分數分析是一套複雜但功能強大的方法,它的核心架構是:

  1. 建立能預測處置機率的傾向分數模型。
  2. 根據傾向分數進行配對或加權,尋找相似的對照。
  3. 嚴格檢查配對或加權後的共變項平衡。
  4. 使用適當的迴歸模型進行最終分析。

對於像從40萬人資料庫找出350多案例的研究設計,傾向分數分析能大幅提升對照組選擇的科學性和分析結果的可信度,使非隨機的觀察性研究更接近隨機試驗的嚴謹度。


留言
avatar-img
留言分享你的想法!
avatar-img
慵懶貓系的小墨魚:數據外的日常觀察
1會員
30內容數
小墨魚,一位白天擅長資料分析與統計建模的數據工作者,夜裡則沉浸在書本與文字裡,透過閱讀與寫作與世界對話。工作之餘,也兼職統計家教,協助學生理解複雜的統計概念與軟體操作。這裡記錄我的書評、生活觀察、科技碎念,有時也寫下關於時間與情緒的小片段。願這些文字,成為我們在日常中相遇的溫柔片刻。
2025/09/26
在臨床研究和流行病學中,我們常常想要回答這樣的問題:「新藥是否比傳統治療更有效?」 一個常見的衡量方式是 勝算比 (Odds Ratio, OR)。然而,如果我們只看整體數據,很可能會掉入陷阱,得到一個誤導性的結論。這時候,「分層分析 (Stratified analysis)」和 Mantel–
Thumbnail
2025/09/26
在臨床研究和流行病學中,我們常常想要回答這樣的問題:「新藥是否比傳統治療更有效?」 一個常見的衡量方式是 勝算比 (Odds Ratio, OR)。然而,如果我們只看整體數據,很可能會掉入陷阱,得到一個誤導性的結論。這時候,「分層分析 (Stratified analysis)」和 Mantel–
Thumbnail
2025/09/24
在資料分析的世界裡,「相關」這個詞看似簡單,背後卻藏著許多細節。當我們想探討兩個變數的關係時,如果忽略了其他潛在的干擾因素,很容易得出錯誤的結論。 這篇文章將深入探討兩個容易混淆的統計概念:「半淨相關」和「淨相關」,並解釋為何在閱讀學術文獻時,需要特別留意它們的用法。
Thumbnail
2025/09/24
在資料分析的世界裡,「相關」這個詞看似簡單,背後卻藏著許多細節。當我們想探討兩個變數的關係時,如果忽略了其他潛在的干擾因素,很容易得出錯誤的結論。 這篇文章將深入探討兩個容易混淆的統計概念:「半淨相關」和「淨相關」,並解釋為何在閱讀學術文獻時,需要特別留意它們的用法。
Thumbnail
2025/09/11
你是否曾經看過這樣的新聞:「冰淇淋銷量越高,溺水人數也越高!」然後開始胡思亂想,難道吃冰淇淋會導致溺水嗎? 當然不是!我們都能直覺地想到,是因為「天氣熱」這個共同因素,導致冰淇淋熱賣,同時也讓更多人跑去游泳,從而增加了溺水機率。 在數據分析的世界裡,我們時常會遇到這種「虛假相關」的陷阱。而幫助我
Thumbnail
2025/09/11
你是否曾經看過這樣的新聞:「冰淇淋銷量越高,溺水人數也越高!」然後開始胡思亂想,難道吃冰淇淋會導致溺水嗎? 當然不是!我們都能直覺地想到,是因為「天氣熱」這個共同因素,導致冰淇淋熱賣,同時也讓更多人跑去游泳,從而增加了溺水機率。 在數據分析的世界裡,我們時常會遇到這種「虛假相關」的陷阱。而幫助我
Thumbnail
看更多
你可能也想看
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
抽樣方式影響調查的樣本結果是否可以代表母體狀況。方便抽樣可能導致偏誤,應考慮更系統化的抽樣方法,例如簡單隨機抽樣,以確保樣本情況可以回推母體情況。文章透過範例說明,解釋樣本和母體之間關聯。
Thumbnail
抽樣方式影響調查的樣本結果是否可以代表母體狀況。方便抽樣可能導致偏誤,應考慮更系統化的抽樣方法,例如簡單隨機抽樣,以確保樣本情況可以回推母體情況。文章透過範例說明,解釋樣本和母體之間關聯。
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
會,因為日常生活中充斥著各式統計報告,若不懂統計,容易被誤導。具有統計概念可以幫助我們找出對的統計報告,做更明智的做出決策。一般人可以先學習如何判讀統計報告和留意統計的應用開始,培養如何獨立思考。
Thumbnail
會,因為日常生活中充斥著各式統計報告,若不懂統計,容易被誤導。具有統計概念可以幫助我們找出對的統計報告,做更明智的做出決策。一般人可以先學習如何判讀統計報告和留意統計的應用開始,培養如何獨立思考。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News