研究員的罩門—機率判斷 —從“阿中部長設普篩兩條件”談貝氏推理(上)

2020/04/17閱讀時間約 8 分鐘
台灣肺炎疫情隨著境外移入增加,民間要求普篩的呼聲漸起,除了阿中部長於記者會表示:真到了需要「普篩」的情形,那會是「社區個案人數暴增」和「感染源不明者」如雨後春筍般出現時,才會考慮去做。學者李建璋也認為有幾個狀況:第一是本土案例開始大幅增加的時候、第二是出現社區傳染的時候、第三是檢驗覆蓋率小於50的時候,台灣才要啟動普篩(註1)。不過仔細想想,普篩不就是為了,超前部署,防範傳染擴大嗎?乍聽之下,當社區個案人數暴增,才要啟動普篩的做法,邏輯似乎有矛盾之處。筆者試著用研究股票時常碰到的機率判斷,來探討此做法可能的合理性。
機率這一門學問在人類文明的進展中,相較在其他學問的建構,顯得相當緩慢。人類早在西元前二、三百年前的古希臘時代,就已建立幾何學的知識,知道房子、橋樑要怎麼施工才會堅固。但是對於兩個銅板出現一正一反的機率有多高,卻是直至十六世紀才有專書討論(註2)。在這長達將近二千年的歷史長河中,人類對機率學的研究呈現空白,更令人納悶的是,從早期兩河文明至古埃及出土的壁畫中,都可看到人類從事賭博的活動。也就是機率早早進入人類生活日常中,但卻遲遲無視其存在。其箇中原因,至今仍是各領域(哲學、數學、心理學、經濟學)學者討論的話題(註3)。從心理學家角度,機率推理是人類認知的罩門(註4),是上帝“造人”時,留下的BUG,以致於我們在遇到有關機率問題時,腦袋就會當機,而出現思考或決策的偏誤(bias)。
機率是對不確定性的度量,也是對風險的衡量。在我們日常生活中,因為機率計算錯誤,導致對風險程度的誤判,而做出不當的決策行為,其實並不少見。以下是一個常見的醫療判斷問題:
假設女性乳癌的盛行率約為2%,某一醫療院所宣稱他們的檢測方法,在受檢者真的有患乳癌的狀況下,其檢測結果有90%會呈現陽性;而受檢者沒有患乳癌的情況下,其檢測結果仍呈現陽性的機率為9%。請問當一個沒有任何症狀的婦女受檢後,呈現陽性反應時,她真的得乳癌的機率有多少?
聽到以上情況,我們通常會因醫院宣稱此檢測的“準確率”高達九成,而直覺認為這婦女得癌的機率,沒九成也有個八成。然若仔細運用高中數學裡貝氏定理來計算,這其實是在求:在檢測呈現陽性的條件下,真正患乳癌的條件機率:Pr(患乳癌∣陽性反應)=?真正答案是16.9%(註5),此婦女真正得癌的機率還不到兩成呢!與直覺的八九不離十,相差甚大。為什麼直覺與事實會有這麼大的落差呢?原因就在於不確定性。
醫學篩檢(Medical Screening)主要目的是在從尚未發病的健康族群之中找出可能罹患疾病的人。我們首先要認清的是:本質上,不管任何檢測都無法做出百分之百肯定的答案,一定存在不確定性。這不確定性(或是錯誤)的來源有可能是來自檢驗本身的局限,有也可能來自操作、取樣的不完美。在統計學上分成有兩個:1、偽陽性(False positive):受檢者沒患病,但檢驗時卻認為有得病。2、偽陰性(False negative):受檢者其實是有患病,但檢驗時認為沒得病。但想提高檢測的“準確率”(口語上的準確率,只是指真陽率(1-偽陰率), 其實並不精確),只降低(避開)前面兩個“偽”還不夠,我們還須要一個數字:盛行率(prevalence,又名基本比率),才能真正算出檢驗的準確率,第三個關鍵數字,對最後檢測結果的機率影響可能非常巨大(註6),以前面乳癌檢測的例子,若盛行率降為1%,其他條件(真陽率、偽陽率)即使一樣,真正患得乳癌的機率就降為4.8%,也就是說,該婦人該擔心的程度(風險),就由近二成,降為不到5%。
回頭看看目前國內的疫情,由於這是一個新的疾病,我們無法用過去統計資料得到一組盛行率的數據。在無法從全台灣(母體)有多少比率患病的資料下,只能用已檢測多少,且測出陽性反應的數據當樣本來替代盛行率,根據開頭引用的新聞,李建璋博士計算,台灣現在約1/120檢驗覆蓋率(可視之為盛行率),僅約0.83%。在這麼低的盛行率下,不管用任檢驗方法,即使有高真陽率,最後都很難達到很高的真正準確率。這也就可解釋,不管是阿中部長,或是學者,都會把發生大規感染訂為啟動普篩的要件(李博士,有明確指出需要在1/50以上)。
由此推測,目前遲遲不啟動普篩的原因是,目前台灣的盛行率太低,即使檢測出呈陽性,斷定此人染病的可信度並不高,唯有當盛行率(傳染擴大時)檢驗的準確度才能提昇(註7)。也就是想經由普篩,超前佈署,將已染病的人找出來,予以隔離治療,達成避免感染擴大的成效會很低,反而會造成漏網之魚(偽陰性的人)失去戒心,疏於防範,昇高疫情爆發的機率。
以上純屬非專業推測,因為筆者並不具備流行病學專業知識,以上純粹從工作上常用的機率判斷推理,竟也能得到“順時中”的結論,覺得莞薾,故為文應時一下,至於是純屬巧合亦或也符合流行病學專業就不是本文關心的重點了。
股票研究才是筆者想要著墨的地方。疾病篩檢與研究股票,看似八竿子打不著的兩件事,其實共同指向一核心問題,醫生要問的是:面對茫茫人海,我如何確認此人可能得新冠肺炎嗎?研究員要問的是:面對茫茫股海,我如何確認這一家公司會是有價值(或安全邊際夠大)的公司?這兩種問題,最後的答案都只能是一個可性能有多高,絕無法得到一個肯定百分之百的明確答案。之所以模糊,是因為這是在不確性狀況下做的機率判斷。下期將介紹研究員在實務上,最艱難的工作(技能):貝氏推理(Bayesian reasoning)。
時間投顧 創辦人 廖國峰 2020/4/16

註2:生於1501年義大利,賭徒怪傑,卡丹諾(Cerolamo Cardano),看穿上述機率是1/2,非當時一般大眾認為的1/4,縱橫賭場,詳見:<<醉漢走路 – 機率如何左右你我的命運和機會>>(The Drunkard’s Walk – How Randomness Rules Our Lives),CH3,曼羅迪諾 Leonard Mlodinow 著,胡守仁 譯,天下文化出版)
註3:詳見<<風險之書:看人類如何探索、衡量,進而戰勝風險>>(Against the Gods: The Remarkable Story of Risk),CH1、CH2,彼得.伯恩斯坦 著,張定綺譯,商業周刊
註4:詳見<<這才是心理學!>>(How to Think Straight about Psychology) 史坦諾維奇 Keith E. Stanovich 著,楊中芳 譯,遠流出版。CH10,人類認知的罩門:機率推衍。
註5:不知你答對了沒,若沒有,也不用沮喪。根據學者吉仁澤(Gerd Gigerenzer)表示,他曾在一場匯集160名全德國頂尖的婦科醫師的研討會,現場出示上述考題,只有不到21%的人能答對。<<風險與好的決策>>(王晉譯,中信出版社)
註6:“真、偽”兩組數據構成統計學上兩個名詞,靈敏度(sensitivity)、特異度(specificity),其間的關係為,靈敏度=真陽率=1-偽陰率。特異度=真陰率=1-偽陽率。<<機率思考>>(Chancing It);羅伯.麥修斯(Robert Matthews)著,高英哲譯,大牌出版社。
註7:疫情擴大了,檢測才有意義的結論,與我們的直覺有點突兀。事實在上在流感的檢測上也是同樣,在流感季節(盛行率高),檢測的可信度是遠高於非流感時期。(關於流感的快篩 | 祁孝鈞醫師)
為什麼會看到廣告
40會員
110內容數
時間投顧的基本資料,讓對我們有興趣的朋友,能夠更快了解我們。
留言0
查看全部
發表第一個留言支持創作者!