在台灣的財經學系圈流傳著一句順口溜:「經濟就是進場忘記,統計就是通通忘記,會計就是快快忘記,」雖是玩笑,但也可見學生對所學學科應用性的疑惑。
這句順口溜流傳的原因是什麼,值得探討,但是「經濟、統計、會計」並不是大學的通識科目,所以,在大多數的情況下,要研究學生對「經濟、統計、會計」這三門學科的看法時,受試族群就已經受到了限制。
也就是說,這類研究在進行前時,學生就已經有「財經組」與 「非財經組」的學習分組,而這樣的分組多不是研究者所能指派的。(這種分組在社會或自然學科其實很常見,比如「社經地位」、「職位高低」、「薪水多寡」或 「性別」、「年齡」都是,在統計分析的專業用語叫做「受試者變相」(subjective variable.)。)
當然,有些研究中,分組的形成基本上是由研究者操控的。比如說,我們要在同一個研究中,比較四種藥品的止咳效果,那麼通常就是由研究者指派受試者到不同組別,接受不同藥品來觀察。至於,怎麼指派呢?基本上就是希望實驗設計中不要出現干擾解釋的變因。
比如說,我們想知道每天早上都喝牛奶的成年人是不是可以延年益壽?於是我們找了100位願意接受研究者指派的成年人當受試著,然後指定其中50位每天早上喝牛奶,另外其中50位每天早上每天不喝牛奶,然後每10年調查這100位受試者的存活率,然後比較這兩組的存活率是否有差別,然後試著說一個故事,這樣應該就算寫完一個基本的研究報告。
至於怎麼分派這100位志願的受試者呢?基本上就是用隨機指派的方式,目的如前所述就是要消除其他會會影響兩組存活率差異的變因。
讓我們來考慮下面一個狀況,假設你沒有做好隨機指派的程序,結果每天早上喝牛奶的一組中老年人比較多,結果形成每天早上喝牛奶的人存活率較低,所以你會在報告中寫下「每天早上喝牛奶的人比較短命」的結論嗎?
應該是不行。因為出現了一個干擾變相叫做「年齡」。每天早上喝牛奶的人十年存活率較低有可能是他們那一組的中老年人比較多。
我們從這也可以看出實驗設計的重要性和不易。
假如說,你經費短缺,所以只能找到50位每天早上本來就有喝牛奶習慣的人還有50位沒有喝牛奶習慣的人,請他們維持原來的習慣,然後等到十年後,再來調查存活率。
當然,在這種情況下,除了「喝牛奶」外,可能會影響實驗結果的因素就更多了,所以有些研究者會覺得應該找更多受試者以去除這些干擾的變因。這在數學上是說得通的,可是應用在自然學科了解實際作用機制(每天喝牛奶如何影響壽命)可能幫助不大。
所以,我們應該要如何理解不同新冠疫苗的防疫效果?其實短時間可能真的不容易有結論,因為RNA病毒本身就很容易突變,防疫效果本就可能有時效性。如果打了「過流行」或 「非本地流行」的疫苗,集體防疫效果自然也要打折。
至於,台灣新冠疫情中,中老年人的死亡率爲什麼特別高?這點也很值得探討,但是當中有很多可能是醫藥專家想不到或不願想的因素,例如健保給付太多慢性用藥會不會是讓有些中老年人面對新冠病毒特別脆弱的原因?
當然,這些都有待後續探討,但是,如果台灣的相關研究單位其實都滿腦子在開發各種新藥時,他們的研究立場其實也與藥廠無異了吧!