別被總體數據騙了!分層分析教你看懂新藥療效

更新 發佈閱讀 4 分鐘

在臨床研究和流行病學中,我們常常想要回答這樣的問題:「新藥是否比傳統治療更有效?」

一個常見的衡量方式是 勝算比 (Odds Ratio, OR)。然而,如果我們只看整體數據,很可能會掉入陷阱,得到一個誤導性的結論。這時候,「分層分析 (Stratified analysis)」和 Mantel–Haenszel 方法 就能幫助我們找出真正的答案。

勝算比 OR 的意義與公式

首先來回顧一下 勝算比 (OR) 的定義。

在二元結局(例如存活/死亡、有病/沒病)下,勝算比公式是:

raw-image

不分組分析:整體勝算比 OR

假設我們蒐集到 400 名病人,其中 200 人接受新藥,200 人接受傳統治療。結果如下:

raw-image

整體數據告訴我們,新藥組的存活率似乎比傳統治療組稍微好一些,OR 約為 1.7。乍看之下,結論可能是:「新藥比傳統治療有效。」

但事情真的這麼單純嗎?

引入分層分析:病情嚴重程度

在實際醫療情境中,病人之間的差異會影響療效。這裡最重要的潛在混雜因子就是 疾病嚴重程度

如果我們把病人依照「重症 vs 輕中症」分層後,得到以下結果:

raw-image

在不同嚴重程度的分層中,我們重新計算 OR:

  • 重症病人:
raw-image

新藥對重症病人效果顯著,存活率明顯高於傳統治療。

  • 輕中症病人:
raw-image

在輕中症病人中,新藥與傳統治療差異不大。

結果顯示:新藥對 重症病人 更有效,而對輕中症病人則效果相近。


Mantel–Haenszel 方法:合併分層結果

如果我們想要計算「整體分層後的加權平均效果」,就需要用到 Mantel–Haenszel (MH) 方法

raw-image

MH 提供一個「合併 OR」的估計值,公式大致為:

其中:

  • ai,bi,ci,di 為第 i 層的 2×2 表格數字
  • ni 為該層總樣本數

套用到我們的例子,MH 合併 OR = 1.75 (95% CI: 1.20–2.50)


同質性檢定

但是,分層結果能不能直接合併呢?這需要透過 Breslow–Day 同質性檢定

  • p > 0.05,代表各層 OR 差異不顯著,可以合理合併,只報告 MH 合併 OR。
  • p ≤ 0.05,代表各層 OR 差異顯著,應分層呈現結果,而不是只給一個合併值。

在我們的例子中,Breslow–Day 檢定 p=0.42,表示沒有顯著異質性 → 因此合併 OR (1.75) 可作為整體結論。

raw-image

分層分析報表整理

最後根據以上分析的結果,可整理一張適合投稿至 SCI 文章的表格形式

表 X. 新藥與傳統治療在不同病情嚴重程度分層下的勝算比 (OR)

raw-image

結論

  • 勝算比 OR 是二元結局下衡量治療效果的重要指標。
  • 如果只看整體 OR,可能忽略混雜因子,導致誤導性的結論。
  • 分層分析 能幫助我們檢視不同族群的療效差異。
  • Mantel–Haenszel 方法 提供合併 OR,但必須先檢驗 同質性
  • 投稿 SCI 期刊時,通常會同時呈現分層結果、合併 OR 以及同質性檢定。


留言
avatar-img
留言分享你的想法!
avatar-img
慵懶貓系的小墨魚:數據外的日常觀察
1會員
30內容數
小墨魚,一位白天擅長資料分析與統計建模的數據工作者,夜裡則沉浸在書本與文字裡,透過閱讀與寫作與世界對話。工作之餘,也兼職統計家教,協助學生理解複雜的統計概念與軟體操作。這裡記錄我的書評、生活觀察、科技碎念,有時也寫下關於時間與情緒的小片段。願這些文字,成為我們在日常中相遇的溫柔片刻。
2025/09/24
在資料分析的世界裡,「相關」這個詞看似簡單,背後卻藏著許多細節。當我們想探討兩個變數的關係時,如果忽略了其他潛在的干擾因素,很容易得出錯誤的結論。 這篇文章將深入探討兩個容易混淆的統計概念:「半淨相關」和「淨相關」,並解釋為何在閱讀學術文獻時,需要特別留意它們的用法。
Thumbnail
2025/09/24
在資料分析的世界裡,「相關」這個詞看似簡單,背後卻藏著許多細節。當我們想探討兩個變數的關係時,如果忽略了其他潛在的干擾因素,很容易得出錯誤的結論。 這篇文章將深入探討兩個容易混淆的統計概念:「半淨相關」和「淨相關」,並解釋為何在閱讀學術文獻時,需要特別留意它們的用法。
Thumbnail
2025/09/11
你是否曾經看過這樣的新聞:「冰淇淋銷量越高,溺水人數也越高!」然後開始胡思亂想,難道吃冰淇淋會導致溺水嗎? 當然不是!我們都能直覺地想到,是因為「天氣熱」這個共同因素,導致冰淇淋熱賣,同時也讓更多人跑去游泳,從而增加了溺水機率。 在數據分析的世界裡,我們時常會遇到這種「虛假相關」的陷阱。而幫助我
Thumbnail
2025/09/11
你是否曾經看過這樣的新聞:「冰淇淋銷量越高,溺水人數也越高!」然後開始胡思亂想,難道吃冰淇淋會導致溺水嗎? 當然不是!我們都能直覺地想到,是因為「天氣熱」這個共同因素,導致冰淇淋熱賣,同時也讓更多人跑去游泳,從而增加了溺水機率。 在數據分析的世界裡,我們時常會遇到這種「虛假相關」的陷阱。而幫助我
Thumbnail
2025/09/11
你是否曾看過兩個完全相反的統計結論,卻不知道該相信哪一個?這可能不是因為數據造假,而是你遇到了統計學上最著名的陷阱之一——「辛普森悖論」。 什麼是辛普森悖論? 辛普森悖論描述的是一種讓人瞠目結舌的現象:當我們把數據分組來看時,每一組都顯示出同一種趨勢;但當我們把這些組的數據合并起來看整體時,趨
2025/09/11
你是否曾看過兩個完全相反的統計結論,卻不知道該相信哪一個?這可能不是因為數據造假,而是你遇到了統計學上最著名的陷阱之一——「辛普森悖論」。 什麼是辛普森悖論? 辛普森悖論描述的是一種讓人瞠目結舌的現象:當我們把數據分組來看時,每一組都顯示出同一種趨勢;但當我們把這些組的數據合并起來看整體時,趨
看更多
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
「競爭」彷彿就是商業社會的代名詞。產品的銷量、員工的業績、市佔的比例,每年每月鬥個你死我活。這些具競爭性的數據,大多數會採用長條圖或是圓餅圖來表示,我們來看一下,如何利用雷達圖的視覺衝突感,來加強數據之間的對比。在商業應用以外、獎項與選舉的候選人支持度也是適用的場合呢。
Thumbnail
「競爭」彷彿就是商業社會的代名詞。產品的銷量、員工的業績、市佔的比例,每年每月鬥個你死我活。這些具競爭性的數據,大多數會採用長條圖或是圓餅圖來表示,我們來看一下,如何利用雷達圖的視覺衝突感,來加強數據之間的對比。在商業應用以外、獎項與選舉的候選人支持度也是適用的場合呢。
Thumbnail
當我們透過潛在類別/剖面/混合分析找出最佳組數後,研究者可能會好奇,這些組數在其它變項是否有差異?事後比較就顯得相當重要,本文將簡介潛在類別/剖面/混合分析事後比較。
Thumbnail
當我們透過潛在類別/剖面/混合分析找出最佳組數後,研究者可能會好奇,這些組數在其它變項是否有差異?事後比較就顯得相當重要,本文將簡介潛在類別/剖面/混合分析事後比較。
Thumbnail
千辛萬苦地把模型跟報表建立起來以後,把結果呈現到行銷主管面前時,一定會被問:你有信心這個數字是對的嗎?我如果聽你的建議,我會在電視廣告多下1千萬,你有信心他會回本?躁進的丟入上百萬的預算,或是砍掉一整個部門都不會是縝密決策的方式,「做個小實驗吧?」是近年來蠻常見的做法
Thumbnail
千辛萬苦地把模型跟報表建立起來以後,把結果呈現到行銷主管面前時,一定會被問:你有信心這個數字是對的嗎?我如果聽你的建議,我會在電視廣告多下1千萬,你有信心他會回本?躁進的丟入上百萬的預算,或是砍掉一整個部門都不會是縝密決策的方式,「做個小實驗吧?」是近年來蠻常見的做法
Thumbnail
HPLC在藥廠是可以說是很實用的儀器,大部分的含量分析Assay和不純物分析Impurities都是用它來進行,既可以定量也可以定性(鑑別用)。你以為在操作上沒問題就一切沒問題了嗎?不!你忘了還有最重要的「數據分析」。
Thumbnail
HPLC在藥廠是可以說是很實用的儀器,大部分的含量分析Assay和不純物分析Impurities都是用它來進行,既可以定量也可以定性(鑑別用)。你以為在操作上沒問題就一切沒問題了嗎?不!你忘了還有最重要的「數據分析」。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News