統計學的發展和協助決策習習相關,然而由於牽涉到現代社會專業分工的問題,使得不同的決策單位在面對問題時,會採取不同的立場檢視問題,這在現代統計學的用語就會說不同立場的單位往往需要採取不同的統計假設。
所謂「統計假設」的概念其實可用下列白天鵝和黑天鵝的故事來解釋。
黑天鵝原產地是澳洲,所以中古世紀的歐洲人大多只見過原產地是中亞的白天鵝,因此,當歐洲人看到來自澳洲的黑天鵝,多覺得很驚嚇,很不可思議,堅持認為「黑天鵝」是非常少見的例子。這時候,如果有人抓到一隻天鵝,要我們猜猜這天鵝是黑的還是白的的時候,應該要怎麼猜才好。大多歐洲人多會堅持選擇猜白的,因為他們的經驗告訴他們黑天鵝很少。這就是「黑天鵝問題」的原型。
再換個角度想,如果我們到了一個陌生的地方,有人要我們猜他從當地抓到的天鵝是什麼顏色?黑的,還是白的?
如果我們用現代統計假設的邏輯來思考,得到的建議就會是這樣的:「我們可以先去抓一百隻天鵝,然後數數其中有多少隻白天鵝、多少隻黑天鵝,如果黑天鵝出現的比例很少,我們就猜是白天鵝好了。當然,如果我們抓到的黑天鵝比例很高,我們就猜是黑天鵝吧。」
乍聽這種說法的人或許會有人覺得這種判斷不靠譜,但這確實就是現代統計假設的基本邏輯,所以,坎伯雷先生才會寫「黑天鵝效應」一書,來指出這種決策的危險性。
當然,這並不是全盤否定統計假設的推論或決定,而只是用語言形式取代數學邏輯來闡述現代統計決策的本質。要如何運用統計決策的推論,還是要看決策者的智慧。
另一方面,「可能性」的判斷確實隱身在各種數據決策當中。
讓我們用美國著名的辛普森殺妻案來說明。
我們都知道,在同一個案子上,檢察官、法官和律師的立場都不會一樣。檢察官主要的職責是起訴犯人,所以他的立場應該是要決定嫌犯(辛普森)犯下殺人罪的機率高不高。如果證據顯示他不太可能犯下殺人罪,按照犯罪偵防的脈絡,檢查官就不應當在這時起訴嫌犯,以免引發無謂的後續爭議。當然,律師的立場與檢察官不一樣,基本上,律師只要接下案子委託,就應當全力為嫌犯辯護。(如果隨著案情發展,律師對案子有了進一步了解,照理也可按照自己的價值觀決定要不要與嫌犯解除違約關係。)
依照上述分析,相信大家就不難明白在偵查系統中,判定嫌犯是否有罪的攻防時,「不在場證明」為何是最關鍵的證明了。
當然,擁有「不在場證明」也不是「不可能犯罪」的保證,東野圭吾的「嫌疑犯X的現身」就是挑戰「不在場證明」的「可信度」(或「可採納性」)的傑作。
接下來回到統計決策的主題 --- 我們要如何用「社會生理」的數據來判斷嫌疑犯犯罪的可能性呢?
辛普森案的例子中,檢方和辯方的爭論中,其實就牽涉到「社會生理數據」的攻防。其中,檢方提出的一項證據是,辛普森有對妻子家暴的紀錄,針對此項指控,辯方中有一位成員是哈佛大學法學院的教授,他提出一項數據指在2500 位當中曾對妻子施暴的丈夫中,只有一名會因此殺妻,因此他主張要在審案時應該要忽略辛普森的家暴紀錄,就手中有的證據辯論。就立場言,這是「護夫派」的立場。
然而,後來有數學人用另一個數據來推算辛普森的殺妻可能,他們要算的是「曾被家暴的婦女中,是被丈夫殺害的可能性有多少?」很明顯的這是「護妻派」想知道的數據。檢察官自然也應該知道這數據,而這就需要知道美國已婚女性中的被丈夫家暴的機會是多少。
根據數學家大栗博斯在<用數學的語言看世界>一書中提供的資料,美國被家暴的女性有兩萬分之一的機會會被丈夫以外的人殺害。所以,我們可以算出每十萬個美國已婚婦女中,大約會有 5 位會被丈夫以外的人殺害。另一方面,受到家暴的婦女中,有兩千五百分之一的機會會被丈夫殺害。所以,若以十萬個美國已婚婦女為單位,那就是 40 人。這樣一來,我們就可以計算出,每十萬個美國已婚婦女中,會有 45 人被殺害,而其中有 40 人是被丈夫殺害的。因此,關於「在被家暴的婦女中,有多少是被丈夫殺害?」這個問題的答案就變成 40/45 了(大約是 0.9 了!)
我們可以因此得知,要從一兩項社會生理數據上來判斷曾經被太太控述家暴的辛普森案,可以因為「立場上的不同」以致在估算上有多大的差異。
那麼,就數據論數據,在辛普森一案上,檢察官究竟應該採行那一種數據呢?這固然見仁見智,但是因為接受審判的是辛普森,他的妻子也已經死了,無法對證,所以在沒有查證辛普森和其妻子的其他家庭生活細節下,單憑一兩項社會生理數據就要判斷辛普森殺妻的可能性大約失之武斷。雖然,「同情死者」可說是一種常見的社會情緒,不過,在這案子上,既然被審判的是「辛普森」,採取「護夫派」的立場似乎並不為過,畢竟在
講究人權的國家,避免冤案應該還是要重於縱放嫌犯。(相關文章:
辛普森殺妻案的逆轉)
或許,「社會生理指標」的相關估算還是用在改善社會的「社會工程」計畫上比較合適,用來判斷個案上相對就容易失準了。
當然,現代病人在龐大的資本家的數據庫前經常也不過是一個小個案而已,站在保護自己的立場,如何選擇適合自己的醫療計畫自然也不當是全部交由醫生決定。
畢竟,醫生和病人的立場經常因為很多社會生理因素的不同,是無法一致的。