費雪(Fisher)既然是從「劍橋下午茶事件」後,開始思索用統計來解決「主觀」與「客觀」的問題,「品茶問題」自然就開始在統計發展中扮演重要角色。
到底,女士品茶(lady tasting tea)是不是真和男士們不一樣,能喝出先加奶與先加茶的不同?
也許,讓我們了解一下「劍橋下午茶事件」中的女士Bristol 的背景,這位女士其實也是位研究人員,但研究的是海藻。由於她表示自己喜歡喝先加奶的茶,所以引發了費雪想用統計方法測試她的說法,最終催生了統計方法中的「虛無假設」的概念。(相關文章:
值得觀察下去。)
以「女士品茶」為例,費雪之所以可以計算p 值,是因為他問了一個巧妙的「假設性問題」——如果 B 女士其實不是根據她的味覺經驗來回答,而是用「2選1」的方式來答題,那麼她全部答對的機會有多少?
因為這個問題的機率空間是已知的,所以我們可以用排列組合的方式排出來或算出來。
現在,如果測試結果是 B 女士 全部答對,而且計算出了 p值是 0.0143,假如你是裁判,必須在此次測試完後,立即決定到底是 B 女士的主張成立,還是男士的主張成立,你要如何判決?
一般來說,除非男士能提出有力的反證,不然應該就是判 B 女士的主張成立了吧!
現在,一起考慮另一個女士喝可樂」的問題。因為「可樂配方有兩種,到底是 Pepsi 還有 Coca 哪一種比較好喝呢?」,所以這問題可就牽涉品牌的高下了!
那麼,如果我們請100位女士來選哪一種比較好喝,然後,選出的那一種,就是比較好喝的那一種嗎?
「好喝」這答案當然是「主觀」的,因人而異。畢竟,即使有100 位 女士共同選出 Pepsi 比較好喝,男士們當然還是有理由說:「男人和女人的品味不一樣。」
這時候,我們就必須決定我們要問的問題是什麼?——「大多數人覺得比較好喝的可樂是什麼?」還是 「男人喜歡的可樂和女人喜歡的可樂一樣嗎?」
總之,我們必須
先釐清問題再來想實驗設計,看如何用收集來的數據幫助我們猜謎。(統計基本上是一種猜測的學科。相關文章:
天機怎麼洩。)
將費雪的實驗設計概念應用到「藥效的檢測」,問題大概就會是 「 用A藥比較好,還是B 藥比較好?」
這問題照理應該也是很主觀的,應該不是單一研究所能回答的問題。只是,一般來說,牽涉到不同藥廠利益,問題就不容易釐清了!
所以,讓我們先考慮一個比較單純的問題 ——
「新開發的 X 藥品到底能不能止咳?」
基本上,這算是「藥效評估」問題。 所以,我們可以回到「女士品茶」的情境,先問一個「假設性問題」:「如果我們給病人喝一杯(應該沒有止咳效果)的綜合維他命,這樣會不會止咳?」
這就是一般在「藥效評估」時所謂的「對照組」。我們必須先有一個參考組,然後再來比對不同止咳藥的止咳效果。
X 藥品的止咳效果至少要比「對照組」好,我們才能肯定其為「止咳藥」吧?
當然,選用的對照組使用的安慰劑不同,就代表檢驗的標準不同。
以新冠疫苗開發為例,如果研究單位用的安慰劑是「生理食鹽水」,是不是代表這開發單位其實並不期待這新開發的疫苗防疫效果太顯著呢?
還有另外一個更嚴重的問題是,如果一個生活圈內的人接種的都是「防疫效果不太明顯」的疫苗,雖然接種後沒有什麼事故傳出,但是解封後,疫情一發不可控制,這狀況又要請誰擔起責任呢?