在現代經濟學中,「選擇」與「決策」是相當受到重視的研究主題,然而,許多古典經濟人強調的「理性」決策,往往卻不見得能為決策者所接受或採納。畢竟,就如同古羅馬名將凱薩在「內戰記」中所說的:「沒有人願意看到事實的全部,人們往往只希望看到自己想看到的現實」。
這句話應用在資訊世界亦然。因為許多人沒有能力承擔事實的後果,所以選擇看到自己想看的資訊。這種現象如果是出現在受聽者身上,往往會以「selective attention」(選擇性注意)稱之,但如果是出現在出示資料者身上就很自然地會以「selective representaion」(選擇性呈現)稱之。在此,「選擇性呈現」多數的情況是指出示資料者刻意呈現部分的資料,而未呈現全部的資料,所以讓接受資料的人「以偏概全」,做出錯誤的判斷。
不過,在現代國家治理中,資訊量往往極為龐大,所以,重要幕僚要對決策者呈現出適當的相關資訊本就需要經過一番整理,不宜全部送上。只是,幕僚究竟應當要送上什麼資訊給決策者參考,自然也牽涉到幕僚的判斷,牽涉到決策者與幕僚之間的互動和信賴程度,值得深入探討,但本文想討論的重點是,決策本身最大的困難之一就是我們往往必須要在「資訊不全」的情況下就做決定,於是統計學才有了「抽樣」技術的出現。
大部分決策者都必須學習抽樣。
對於有疑義的菜餚,吃了一口菜覺得不對,最好就不要再繼續吃下去,堅持吃完整盤,再決定這盤菜有沒有問題,未免太遲。政府監測疫情,如果覺得狀況不對,最好就要採取措施應變,堅持等相關數字都失控了再來提升防疫等級,絕對稱不上超前部署。這部分應該屬於大多數人都可以接受的決策常識。
至於抽樣本身,則是可以獨立於決策之外來討論的一門術數。
只是,要討論抽樣,就要討論母群,而這就牽涉到資訊收集者想要收集的資訊是什麼,想要做的決策是什麼。
以民意調查來說,選舉前做民意調查的目的很明確,就是要了解選民的意向或者影響選民投票的意向。所以,如果是單純要了解選民意向,抽樣時,自然就會抽能夠代表全體選民代表的樣本。然而,如果是希望透過調查結果影響選民投票意向,抽樣時自然考慮就要多些,甚至連設計問卷時也要花點心思。這樣,才可以達到原先設定的目標。等資料都跑出來了,再想法修改資料,絕對是下策。
至於疫情調查,既然這是因應疫情所做的調查,自然也要搞清楚相關單位做調查的目的是什麼,然後決定母群是什麼,再決定怎麼抽樣比較好。對於資訊調查機構而言,即使只是要了解一下經過核酸檢測後,有多少人確診,也要了解一下目標母群是什麼?和破口有關的被感染群?還是某一地區的被感染群?還是某一段時間,在某一地區的病毒擴散狀況?或者,更高一層,這些資訊是要用來調控醫護人員的調度、或者研發疫苗或者擬定防疫機制,這些都需要請主事者把問題研究得更徹底一些。
主事者把自己想要問的問題釐清的更清楚一些,自然有助於幕僚從事資訊收集與分析。
主事者自己沒法釐清問題,相關幕僚單位自然無從規劃資料的整理和分析。
從這點看,在台灣新冠疫情中出現的「校正回歸」技術,其實就是技術性的小問題了。如果是擔心因檢驗塞車問題嚇到民眾,那就宣布從今後開始,公布的數據都尚未經過「校正回歸」,只是這樣一來,不但苦了相關的資訊處理人員,也會讓民眾對新公布的數據感到疑惑。
因此還有一種辦法,就是暫停公布幾天,等處理完塞車問題後,再重新公佈全都「校正」過的數據也可以。
關於這點,就如同曾仔細觀察過台灣民眾的統計專家後藤新平所觀察到的:「台灣人是很怕死的」。在這種情況下,即使沒有公布數據,只要主事者願意示警,很怕死的台灣人基本上應該都是很願意配合防疫的。
這種觀察自然是相對的。不過,比較台日兩國在新冠疫情上的表現,就可以理解,台灣雖然沒有機會主辦奧運,但如果有,在新冠疫情的威脅下,民意調查應該還是會強烈支持停辦奧運吧!