統計學是在二十世紀開始進入自然科學的領域,而在這當中,貢獻最大的當屬英國的統計分析學家費雪 RA Fisher,他利用其數據長才,建立了新一代的遺傳演化演繹方法,為族群遺傳學 (population genetics) 之父。
不過,從族群遺傳學這學科,各位讀者就應該猜測出來,這當中牽涉的數據量很大,所以,要對害怕大數字的讀者講解費雪對統計的分析貢獻,或許還是要從簡單的日常生活開始說起。
這就是為什麼在統計科普書籍中,「女士品茶」(或譯「喝茶的女士」)的故事廣為流傳。
話說 1920 年代,一群大學教員和他們的賓客一起在戶外喝下午茶。其中一位女士表示,喝茶時,將茶倒入牛奶和將牛奶倒入茶的味道是不同的。在場的許多科學家(從他們的化學知識來看)認為這種說法是很可笑的。但女士非常堅持相信自己的感覺。
當男士們不知要怎麼說服這位堅持「主觀」的女士時,費雪登場了。當時他在倫敦北部的一個農業研究所工作,很認真地看待這位女士表達的意見,並且決定設計一個實驗來確定女士是否真能分辨哪些奶茶是先加茶的。( 剩下的,自然是先加奶的奶茶。)
如果我們將女士正確指出的答案以X表示,那麼 X 就有 0,1,2,3,4 這五種可能。即使沒有統計分析,我們也可以知道 X 值越大,女士就越厲害,但費雪後來能成為自然科學中的實驗設計之父,就是他能讓數據更精細一點,他可以估計女士是用「矇」對的機會有多高。
當然,要估計出這個值就要假設 。他的假設是「如果該女士其實完全不會分辨奶茶的味道,而只是在說大話而已」,有了這個假設,再運用基本的排列組合知識,就可以算出,女士完全不會分辨,但完全答對,得到 X=4 的機會有多少。
這問題計算不難,所以有興趣的朋友可以拿起紙筆算一算,到底是多少。
(下面這部影片有費雪的聲音親自上陣介紹「女士品茶」的實驗設計。)
所以,回到原先的問題:「如果女士其實不會分辨,完全是用『矇』的,那麼她完全猜對的機率有多少?」
如果你的排列組合學得不好,有人幫你算出來,答案是 0.0143,你覺得怎麼樣?
費雪建議將這個值叫做 p-值。
雖然現在有很多文章對這個 p 值的意義有很多批評,不過回到「女士品茶」的問題,這個 p 值告訴我們的基本上是「女士完全答對,但其實只是運氣好的機率是 0.0143」。
再回到1920年,那個下午茶的茶景,如果你也在座,你要怎麼面對女士和其他劍橋教員的爭執? 你覺得應該要相信那位女士的「主觀」還是其他男士的「客觀」?
作為一個謹慎的研究員,也許最適當的答案是「繼續觀察下去」⋯⋯ 於是統計學界有了「significant」這個字。這個字最合適的中文翻譯應該是「值得注意的」,只是在大眾傳播界常都被解釋為統計結果獲得「證實」或 「證明」。
當然,如果將這延伸到新疫苗或新藥的開發,即使通過初步的解盲測驗,也不應就將其視為疫苗「安全性」或 「有效性」的保證,這應當是可以理解的,而且要分辨藥品的「安全性」和 「有效性」,大概不是初期的測試結果能回答的,需要繼續研究下去。
只是,疫苗開發本身雖有危險性,但過於注重「安全性」,而犧牲「有效性」,恐怕不能對「集體防疫」產生效果,新冠病毒又屬 RNA病毒,很容易突變,很多疫苗的保護效果恐怕也有時效性,決策者在觀察的同時,其實也應該要迅速做出更周全的決定,才不會讓疫情持續下去,早日完成「安心解除警戒」的目標。