
一套數據,跑出1253種解釋方式。最後發現,學者的意識形態,也能影響科學研究的結果。
同樣一套大數據,讓不同意識形態的學者分析,就常會跑出與學者意識形態相符的結果。
當我們對一個問題持有先入為主的觀點時,就常會在無意識中尋找證據來支持這個觀點。經過科學訓練的學者也無法避免「動機性推理」,也就不奇怪,當我們談論政治與社會問題時,支持不同政黨與意識形態的人,對同一件事情會有完全不同的看法。這是George J. Borjas 與 Nate Breznau這兩位重量級學者,最近發表的研究結果。他們的研究,是對社會科學面臨「複製危機」(許多被視為經典的實驗結果,無法在後續研究中被重現)後的深刻反思。傳統觀點認為,科學研究是客觀事實的挖掘過程,數據本身具有唯一且確定的真理。然而,2022 年他們稱為「隱藏宇宙」的實驗,透過讓 71 個研究團隊、158 位研究者分析同一組「國際社會調查計畫」數據,針對「移民是否減少公眾對社會福利的支持」這一相同命題,竟產生了 1,253 種截然不同的統計模型與結論。
傳統的研究模式通常是「單一團隊、單一數據、單一分析」。在這種模式下,研究者擁有巨大的「研究者自由度」,可以透過這種自由來尋找統計顯著性、或根據結果調整假設。
但這些「單一團隊」產出許多無法複製的研究結果。為了應對這一挑戰,有些學者開創「元科學(metascience)」領域引入「多重分析者」的研究方式,將同一組數據分發給多個獨立的研究團隊,要求他們測試同一個假設。如果科學是客觀的,那麼理論上,只要數據相同、問題相同,受過嚴格訓練的科學家應該會得出高度一致的結論。
Breznau 等人 2022 年的實驗徹底粉碎了這個天真的預設,但,為什麼?在最初的分析中,Breznau 等人得到一個悲觀的結論:這些結果的變異大部分是無法解釋的。他們嘗試用研究者的資歷、使用的軟體、統計方法的類別來解釋這些差異,但發現這些客觀特徵都無法有效預測誰會算出什麼結果 。他們因此將這種現象稱為「數據分析的隱藏宇宙」,暗示科學分析中存在著巨大的不確定性。
就在學界即將接受「科學充滿不可知的不確定性」這一結論時,哈佛大學經濟學家 George J. Borjas 與原作者 Nate Breznau 合作,於 2026 年發表了新的研究。他們重新審視了 2022 年的數據,並引入了一個先前被忽視、或未被充分挖掘的解釋變數:研究者的意識形態。
Borjas 與 Breznau 的核心論點是:2022 年的研究之所以認為變異「無法解釋」,是因為原本的回歸模型設定錯誤。重新檢視數據後發現,研究者在選擇模型、選擇哪些控制變數時,意識形態帶來的偏誤就會影響研究結果。
2022年的研究,在接觸數據進行分析之前,所有參與研究者都填寫了一份關於個人政治立場的問卷,詢問他們對移民政策的態度。2026年的研究發現,親移民團隊傾向發現移民對社會福利支持有正面影響(例如增強社會凝聚力),反移民團隊傾向發現移民對社會福利支持有負面影響(例如破壞社會契約)。
對於政策制定者來說,這意味著依據親移民學者的研究會得出「開放移民無害」的結論,而依據反移民學者的研究則會得出「開放移民將瓦解福利國家」的結論。
但這些差異並不是來自「數據造假」或「篡改數字」,而是來自符合學術規範的「模型設定的選擇」。
統計分析並非一條直線,而是一座充滿分岔路口的迷宮。在處理「國際社會調查計畫」這種複雜的跨國數據時,研究者必須做出無數微小的技術性決策。每一個決策點都開啟了一條新的路徑,在無意識的認知偏誤的影響下,最終通往不同的結論。
研究辨識出五個最具決定性的「分岔路口」,這些決策解釋了親移民與反移民團隊之間約三分之二的結果差異。接下來會寫到許多專有名詞,讀者不需要看懂(我也不懂),我們只要大概能理解,叉路是如何形成?
1. 依變數的聚合方式 (Scaling of the Dependent Variable)
- 問題:社會福利支持是一個抽象概念,問卷中可能包含「你支持政府增加醫療支出嗎?」、「你支持增加失業救濟嗎?」、「你支持增加養老金嗎?」等多個問題。
- 選擇:研究者應該將這些問題加總成一個總分?還是取平均值?還是進行因子分析(Factor Analysis)提取潛在變數?或者只挑選其中最具代表性的一項?
- 偏見運作:也許親移民團隊發現,如果只看「醫療支出」,移民的影響是正面的;而反移民團隊發現,如果只看「失業救濟」,影響是負面的。他們會傾向於選擇那個顯示出自己預期結果的聚合方式,並認為這是「最合理」的指標。
2. 移民的測量 (Measurement of Immigration)
- 問題:什麼是「移民」?
- 選擇:是使用「外國出生人口佔總人口的比例」?還是使用「過去一年新進入的移民人數」?還是「低技能移民的比例」?
- 偏見運作:存量和流量對社會的影響機制不同。長期存在的大量移民社群可能已經融入,顯示正面影響;而短期的快速流入可能引發社會恐慌,顯示負面影響。研究者可能會無意識地選擇那個能捕捉到他們心中「移民衝擊」的測量方式。
3. 統計方法的選擇 (Statistical Methods)
- 問題:使用哪種回歸模型?
- 選擇:普通最小平方法?邏輯斯回歸?還是考慮國家層次變異的多層次模型?
- 偏見運作:不同的數學假設會放大或縮小某些效應。反移民團隊可能偏好某種能放大變異的模型,而親移民團隊可能偏好能平滑趨勢的模型。
4. 國家樣本的選擇 (Inclusion of Countries)
- 問題:數據涵蓋了從瑞典到俄羅斯的多個國家。
- 選擇:是否要排除前共產主義國家?是否要排除福利制度不完善的國家?
- 偏見運作:某些國家(如東歐國家)可能因歷史原因對移民特別排斥。反移民團隊可能會認為「這些國家也是樣本的一部分,不能排除」,從而拉低整體平均值;親移民團隊可能會認為「這些國家是特例,會扭曲結果,應該排除」,從而得到較正面的結論。
5. 數據波次的選擇 (Specific Data Waves)
- 問題:數據涵蓋 1985-2016。
- 選擇:是使用所有年份?還是只關注最近十年?
- 偏見運作:2015 年歐洲難民危機前後的數據可能截然不同。選擇包含或排除特定年份,將直接決定趨勢線的斜率。
Borjas 與 Breznau 的分析顯示,那些能產生「最強烈負面效果」的模型設定,幾乎完全是由反移民團隊所採用;反之亦然 。這揭示了一種被稱為「動機性推理」(motivated reasoning)的心理機制,並通過「非對稱的停止規則」(Asymmetric Stopping Rules)來實現:
- 情境 A:研究者算出了一個符合自己立場的結果(例如親移民者算出正面影響)。
- 反應:「很好,這證明了我的假設,模型設定正確。」
- 行動:停止分析,撰寫報告。
- 情境 B:研究者算出了一個違背自己立場的結果(例如親移民者算出負面影響)。
- 反應:「這不合理,一定是模型哪裡設錯了,或者是控制變數不夠,或者是這個測量指標有問題。」
- 行動:繼續嘗試其他模型設定,直到算出「合理」(符合立場)的結果為止。
這種機制並不需要研究者有意識地造假。相反,他們通常真誠地相信自己是在「修正錯誤」,試圖找到「最正確」的模型。然而,正是這種對「錯誤」(違背立場的結果)的過度檢查和對「正確」(符合立場的結果)的輕易放行,導致了最終發表的文獻充滿了系統性的偏見。
結語:
當通過學術訓練的人在跑統計數據時,也難以避免自身意識形態的影響,我們又如何能確認自己的「理性、客觀、中立」?
「認知偏誤」普遍存在所有人類大腦,包括頂尖的學者、政治家、創業家都會有認知偏誤。我們應面對、接受這事實,接受這世界並沒有什麼「一定是這樣」、「一定會那樣」的事情。
最初的資料來源:
158 scientists used the same data, but their politics predicted the results















