在推崇理性的科學分析中,檢驗是展現數據理性的常用手段,而檢驗結果往往夜也是決策者下決策的重要依據。然而,對於檢定本質的不了解,往往也使人們誤解檢定結果的意義,造成許多爭議。
這些爭議有些是限於情勢本身的不明朗,有些則是出於選擇性的解讀資料,還有些是出於選擇性的呈現資料,當事者若能了解這些相關爭議,自然有助於澄清局面,從而做出一個讓自己可以願意面對後果的決定。
遺憾的是,現在許多醫療資訊以及醫療照顧的收集與決策權其實都掌握在所謂醫療專家的手中,所以一般人也就大多放棄自己對健康的管理權,傾向於認為自己必須採納醫師的所有建議,否則將有嚴重後果。
然而,真是如此嗎?到底我們應該如何避免機率陷阱,做個懂得掌控風險的決策者呢?
在「風險決策」一書中,作者蓋格瑞澤提供了這樣的例子,說明一般醫生對於檢測結果的認識:
讓我們從作者提供的題目看起 ——
有一名五十歲的婦女,在身體從未出現明顯的症狀下,參加了例行性的乳房X光造影檢查,結果顯示為陽性。她嚇壞了,想向你徵詢更多有關乳癌的後續進程和治療。你對這名婦女的其他資訊一無所知,但如果請你評估,一名檢查結果為陽性的婦女,她得乳癌的機率是多少?
這是作者蓋格瑞澤在一項演講中,針對160名婦產科醫生所提出的問題。所以,上述問題中的「你」指的是醫生。
不過,即使是醫生,不了解測試相關數據,也還是無法回答這類問題。所以,作者又提供了相關資訊,嚷醫生們作答:
第一,女性罹患乳癌的機率是 1%。(這是一個「事件機率」)
第二,如果有一名婦女有乳癌,那麼其檢驗結果為陽性的機率為 90%。(意思是,這個檢驗的「敏感度」為 90% )
第三,如果有一名婦女其實沒有罹患乳癌,那麼其檢驗結果為陽性的機率為 9%。(意思是,這個檢驗的「偽陽性」為 9% )
現在如果有一個婦女檢查結果為陽性,她想要知道自己罹患乳癌的機率如何,你應當如何告訴她?(這就算是「確診率」。)
關於這個問題的答案我們暫不忙於計算。可是我們應當學會認識幾個和檢驗有關的機率概念:事件機率、敏感度、偽陽性、確診率 --- 如果知道這些事件的其中三種,按理就可以推出其中三種。
雖然機率這種事,在醫藥公司收集和分析資料的階段時,原就充滿各種可以操弄的空間,但是基本上這四種機率(事件機率、敏感度、偽陽性還有確診率)都是互相連動的,屬於數學上的特性,不會因為人為操弄而改變。
應用到新冠疫情的觀察上,我們可以了解如果我們在接受核酸檢測後,即使結果是陽性,也不代表就一定會確診,至於結果是什麼,要看「確診率」是多少,而這是可以由事件機率、檢測的敏感度和偽陽性計算出來的。
那麼,也許我們可以一起想想,新冠疫情中,我們最想估計的機率值是什麼?也許,不是確診率,而是事件機率。例如,某一城市的居民在自己城市染上新冠肺炎的機率是多少?或者,如果我們到另一個城市時,染上新冠肺炎的機率又是多少?
這些也許才是一般小老百姓想要知道的資訊,至於檢測的敏感度、偽陽性 和 確診率那些數值,其實都比較屬於醫療機關需要的資訊!
當然,作為一個熱愛數字的數字人,我們也可以趁機了解一下從「事件機率」、「敏感度」、「偽陽率」來計算「確診率」的方式。
不過,在此之前,讓我們提供一下答案讓大家選擇:
A. 90% ---意思是十位檢查結果為陽性的女性中,有九名真的罹患了乳癌。
B. 80% ---意思是十位檢查結果為陽性的女性中,有八名真的罹患了乳癌。
C 10% ---意思是十位檢查結果為陽性的女性中,有一名真的罹患了乳癌。
D 1% ---意思是一百位檢查結果為陽性的女性中,有一名真的罹患了乳癌。
如果有學過機率學的讀者不妨拿出紙筆算一算吧。
下面列出當初作者在柏林調查的一百六十位醫生當中透過投票系統選擇的答案。
有 47%的醫生認為是A,13%的醫生認為是B、21%的醫生認為是C,19%的醫生認為是D。
當然,這些數據都是根據作者所提供的資料所算出來的,所以如果有熟悉機率的朋友就可以很明確的用這些資料算出答案其實是C。
如前所述,我們現在大多數的醫療數據都由醫藥廠所掌控,所以,要計算也只能是用藥廠提供的資料來算。
當然,知道某一地區的醫生如何評估某一事件的主觀機率,對資料分析者應該也是很有意義的資料。不知道,如果有民意機構請160名醫生或公衛專家估計一下以下這個事件「在2021年6月,按照目前疫情進展,一位雙北居民染上新冠肺炎的機率是多少?」的機率,答案會是多少?
順便,可以用一下下面參考資料,回答一下雙北居民,這樣的疫苗分配方式對雙北居民公平嗎?