2023-08-10|閱讀時間 ‧ 約 3 分鐘

囚徒困境


囚徒困境是賽局理論中很常見,可以應用在很多情境的分析工具。它的故事雖然有很多版本,但大致上是一個警察抓到兩個歹徒,設法讓他們招供。警察抓到兩個歹徒後,將歹徒們關在不同的房間,並分別告訴他們,如果一個人坦白,另一個人不坦白,招供者關 1 年,不招供者關 15 年;如果都坦白,都關 10 年;如果都不坦白,都關 3 年。

如果把兩個歹徒選擇坦白跟不坦白的可能性可以畫成以下表格,就會形成一個4X4 的矩陣。這個表格叫做報償矩陣,因為它可以把所有可能性裡的報酬用矩陣表示。如果你是其中一位歹徒,你會怎麼選呢?

報償矩陣

假設你是 A 歹徒,如果 B 坦白,對你來說最好的選擇是坦白,因為坦白被關 10 年,不坦白則是關 15 年;如果 B 不坦白,對你來說最好的選擇還是坦白,因為你坦白只關 1 年,不坦白則是關 3 年。對你來說,無論如何,選擇坦白是最好的選擇。在賽局理論裡,這種選擇被稱為優勢策略(無論對手選擇甚麼,你都只有這個最好的選擇)。

如果你仔細看上方表格的報償矩陣,你會發現雙方都不坦白才是對大家最好的選擇,但是沒有人會選擇不坦白,因為害怕被對方偷吃步、背叛。這種情境就是所謂的囚徒困境,用白話來描述:「個人的最佳選擇並非群體的最佳選擇」。

囚徒困境的分析可以應用在很多情境,例如軍備競賽或是考試。在學校,校排名是用考試成績來排的。誰成績高,誰的排名就比較前面;如果成績相同,名次就會並列。如果前幾名的同學競爭激烈,對他們來說,最好的結果是並列第一。你想想看,這種情況有可能發生嗎?他們有可能約定一起考一個固定的分數嗎?

依據賽局理論的分析,這種情況在鼓勵競爭的制度下不太可能發生。下表是同學的報償矩陣。不管你從 A 同學還是 B 同學的角度來看,大家都有作弊的誘因,只要不守約定就可以獨佔第一,大家會陷入典型的囚徒困境。


同學的報償矩陣


參與賽局的玩家會選擇背叛對方,而不選擇合作。要改變這種賽局困境,最簡單的辦法就是將賽局改成重複多次,並且讓懲罰夠重。當參與者能夠多次重新選擇,參與者就有機會去「懲罰」另一個參與者前一回的不合作行為。然後懲罰夠重的話,參與者會考慮到背叛所帶來的損失,進而選擇合作。


你有想過為什麼墾丁大街上的攤販賣的東西貴得離譜嗎?因為觀光客人數夠多,通常只會來這個地方一次,所以攤販們能騙觀光客一次是一次。正因為這種一次性的遇見,攤販沒有選擇和消費者合作的誘因,欺騙消費者是最好的選擇。反觀旁邊的麥當勞、星巴克、肯德基,它們就不會因為身處墾丁而抬高價高或是改變商品。它們是連鎖店,不只是在墾丁設點,也在其他地方經營,一旦名聲受損,就會連帶影響其他分店。所以對連鎖店來說,它和消費者的關係就不是一次性的,而是多次性的。它不會也不能欺壓消費者,因為它必須要維持在消費者心中的形象。

生活中還有很多情境可以用囚徒困境來解析,以後想到再來分享!



分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.