最近讀到關於文獻中的統計陷阱的資料,覺得深受啟發,迫不及待要來和各位分享!希望我們未來在閱讀文獻時更能夠看出一些端倪和貓膩。
我們都知道「p < 0.05」代表有顯著差異,但卻很容易誤解 p > 0.05 的意思。我們以法律來類比一下各種統計術語:
- 目標:整個訴訟過程都是在證明被告有沒有罪
- 假說:假設被告是無罪的(null hypothesis)= 無罪推定 = 被證明有罪前都是無罪的
- 研究數據:檢察官蒐集的犯罪證據
- p-value:如果被告真的是無罪的,檢察官還能拿出這些犯案證據的機率
p < 0.05 代表什麼?
當 p < 0.05 時,表示證據非常夠力,像是錄音檔、監視器畫面等很強力的證據。若被告是無罪的,還能發現這些證據的機率太低了(<5%)。因此我們拒絕「被告無罪」這個假說,而判定其「有罪」,也就是「有顯著差異」。p > 0.05 代表什麼?
當 p > 0.05 時,表示證據不太強,例如無法辨識人臉的監視器截圖。即使被告是無罪的,還是滿有可能發現這些證據(>5%),因此我們沒有足夠的證據說被告有罪,於是依照無罪推定原則,判定被告「無罪」,也就是「無顯著差異」。
無罪等於絕對清白嗎?
無罪只能說明「這次的證據不夠定他的罪」,並不直接等於「絕對清白」。一個殺人嫌疑犯因為成功滅證而被無罪釋放,但他本質上還是殺人犯,只是找不到證據定罪而已。
------
接著讓我們回到日常的文獻,2021年一篇關於貓使用prazosin是否能減少尿道阻塞復發率的研究,結論大家應該都很熟悉,使用prazosin 和 placebo 治療的組別,其尿道阻塞的復發率沒有顯著差異(p = 0.27)(甚至prazosin治療的貓復發率是30%,安慰劑治療的貓復發率只有18%)。
以前看到這樣的描述,我會這麼想:「原來prazosin一點用都沒有,反正也買不到就不要用了」。
但更正確的解讀應該是:這篇研究沒辦法證明prazosin能減少阻塞復發(無法證明有罪),但不代表真的沒有用(不代表真的清白)。作者也在討論中指出,他們的研究因為樣本數不足,檢定力是不夠的。
這篇研究的目的是希望證明prazosin有用但失敗了(superiority trial),但若反過來要證明prazosin效果跟安慰劑一樣差(也就是沒用),那就需要使用完全不同的研究框架,以及更大的樣本數,來作non-inferiority trial。
簡單地說,當看到研究結果是沒有顯著差異時,要小心不要下錯結論~












