
囚徒困境
囚徒困境是博弈論(Game Theory)中最著名的模型,由梅里爾·弗勒德(Merrill Flood)和梅爾文·德萊希爾(Melvin Dresher)於 1950 年構思。它揭示了一個深刻的矛盾:當每個人都試圖追求自身利益最大化時,最終的結果往往對集體(甚至對個人)都是不利的。
1. 經典模型設定
想像兩名犯罪嫌疑人(甲和乙)被警方逮捕,分別關在不同的房間審訊,彼此無法溝通。警方證據不足,需要至少一人招供才能定重罪。警方給出的條件如下: 若兩人都保持沈默(合作): 警方因證據不足,僅能以輕罪起訴,兩人各判 1 年。 若其中一人招供(背叛),另一人沈默: 招供者因轉為污點證人而立即釋放,沈默者則判重刑 10 年。 若兩人都招供(互相背叛): 兩人都判重罪,但因有認罪表現,各判 5 年。
如下圖:收益矩陣 (Payoff Matrix)

收益矩陣 (Payoff Matrix)
2. 邏輯推演:為什麼會陷入困境?
從甲的角度來看:
- 如果乙沈默,甲招供(0 年)比沈默(1 年)更好。
- 如果乙招供,甲招供(5 年)也比沈默(10 年)更好。
- 無論乙怎麼做,對甲來說「招供」都是最優策略。乙的邏輯完全相同。
- 納許均衡 (Nash Equilibrium): 當兩人都選擇「招供」時,達到了一個穩定的平衡點(5, 5)。在此狀態下,任何一方單方面改變決定(變為沈默)都會讓自己判得更重。
- 帕累托最優 (Pareto Optimality) 的缺失: 雖然(1, 1)對兩個人來說整體最優,但因為缺乏信任與強制契約,理性的個體無法達到這個狀態。
3. 現實生活中的應用
囚徒困境不僅是學術模型,它解釋了許多社會與經濟現象:
- 價格戰: 兩家公司若維持高價可共獲利(合作),但為了搶市佔率紛紛降價(背叛),最終導致利潤枯竭。
- 軍備競賽: 兩國若不研發武器可節省預算,但擔心對方研發,只好被迫投入巨資競爭,結果兩國財政壓力倍增但安全感並未提升。
- 公共財悲劇: 每個人都想多用公共資源(如漁場、乾淨空氣)而不願維護,最終資源枯竭。
4. 如何破解困境?
在現實中,我們並非總是陷入僵局,常見的破解方式包括:
- 重複博弈 (Iterated Prisoner's Dilemma): 如果博弈不是一次性的,而是長期的,參與者會考慮「名聲」與「報復」。最有效的策略通常是 「以牙還牙」(Tit for Tat):第一輪合作,之後每一輪都模仿對方上一輪的行為。
- 建立契約與監督機制: 透過法律、合同或第三方仲裁,對「背叛者」施加懲罰,改變收益矩陣。
- 社會規範與信任: 強烈的道德觀、宗教或團隊文化能增加「背叛」的心理成本,促使成員趨向合作。
- 核心啟示: 囚徒困境告訴我們,單純的個體理性(Individual Rationality)可能導致集體的不理性。


















