2023-08-10|閱讀時間 ‧ 約 3 分鐘

囚徒困境

囚徒困境是賽局理論中很常見，可以應用在很多情境的分析工具。它的故事雖然有很多版本，但大致上是一個警察抓到兩個歹徒，設法讓他們招供。警察抓到兩個歹徒後，將歹徒們關在不同的房間，並分別告訴他們，如果一個人坦白，另一個人不坦白，招供者關 1 年，不招供者關 15 年；如果都坦白，都關 10 年；如果都不坦白，都關 3 年。

如果把兩個歹徒選擇坦白跟不坦白的可能性可以畫成以下表格，就會形成一個4X4 的矩陣。這個表格叫做報償矩陣，因為它可以把所有可能性裡的報酬用矩陣表示。如果你是其中一位歹徒，你會怎麼選呢？

報償矩陣

假設你是 A 歹徒，如果 B 坦白，對你來說最好的選擇是坦白，因為坦白被關 10 年，不坦白則是關 15 年；如果 B 不坦白，對你來說最好的選擇還是坦白，因為你坦白只關 1 年，不坦白則是關 3 年。對你來說，無論如何，選擇坦白是最好的選擇。在賽局理論裡，這種選擇被稱為優勢策略(無論對手選擇甚麼，你都只有這個最好的選擇)。

如果你仔細看上方表格的報償矩陣，你會發現雙方都不坦白才是對大家最好的選擇，但是沒有人會選擇不坦白，因為害怕被對方偷吃步、背叛。這種情境就是所謂的囚徒困境，用白話來描述：「個人的最佳選擇並非群體的最佳選擇」。

囚徒困境的分析可以應用在很多情境，例如軍備競賽或是考試。在學校，校排名是用考試成績來排的。誰成績高，誰的排名就比較前面；如果成績相同，名次就會並列。如果前幾名的同學競爭激烈，對他們來說，最好的結果是並列第一。你想想看，這種情況有可能發生嗎？他們有可能約定一起考一個固定的分數嗎？

依據賽局理論的分析，這種情況在鼓勵競爭的制度下不太可能發生。下表是同學的報償矩陣。不管你從 A 同學還是 B 同學的角度來看，大家都有作弊的誘因，只要不守約定就可以獨佔第一，大家會陷入典型的囚徒困境。

同學的報償矩陣

參與賽局的玩家會選擇背叛對方，而不選擇合作。要改變這種賽局困境，最簡單的辦法就是將賽局改成重複多次，並且讓懲罰夠重。當參與者能夠多次重新選擇，參與者就有機會去「懲罰」另一個參與者前一回的不合作行為。然後懲罰夠重的話，參與者會考慮到背叛所帶來的損失，進而選擇合作。

你有想過為什麼墾丁大街上的攤販賣的東西貴得離譜嗎？因為觀光客人數夠多，通常只會來這個地方一次，所以攤販們能騙觀光客一次是一次。正因為這種一次性的遇見，攤販沒有選擇和消費者合作的誘因，欺騙消費者是最好的選擇。反觀旁邊的麥當勞、星巴克、肯德基，它們就不會因為身處墾丁而抬高價高或是改變商品。它們是連鎖店，不只是在墾丁設點，也在其他地方經營，一旦名聲受損，就會連帶影響其他分店。所以對連鎖店來說，它和消費者的關係就不是一次性的，而是多次性的。它不會也不能欺壓消費者，因為它必須要維持在消費者心中的形象。

生活中還有很多情境可以用囚徒困境來解析，以後想到再來分享！

分享至

成為作者繼續創作的動力吧！

幹話胡蘿蔔

追蹤

從 Google News 追蹤更多 vocus 的最新精選內容