2023年最具張力的線上直播,莫過於君悅飯店的大亂鬥。大部份人應該都知道直播最後是以尿尿跟奶茶收場,然後賴清德就回總統府準備換辦公室。
有人說在藍白合這個賽局中,最後,候與柯陷入了囚犯困境(Prisoner's Dilemma)。是這樣嗎?
什麼是囚犯困境?google的普及率應該被尊重,所以這裡就不再做一個複製跟貼上這樣的一個動作。便直接切入重點:
1.囚犯困境最主要的精神,在於每個人都做對自己做最有利的選擇(策略),結果反而落到一個對自己不利的狀態(均衡)中。
2.例如,期末考就會落入囚犯困境的狀態。全班同學如果都能講好一起擺爛,沒有人偷唸書,沒比較沒傷害,當全班一樣爛時老師要怎麼當人?但如果當我知道我的同學們都在擺爛,我有沒有動機偷唸一下?混了一整個學期,偷唸一個晚上就可以考全班最高分,我有沒有動機偷唸?然後你會這樣想,你同學也會這樣想,每個人都偷唸。最後雖然還是pass,但你除了付出了熬夜的代價還大大降低了拿全班最高分的機率,相較起原本如果每個人都不唸書的策略(爽拿學分),偷唸的策略(熬夜拿學分)就落入了囚犯困境的均衡狀態。因為同樣拿到學分,辛苦熬夜相較起爽爽拿學分就是一個較差的狀態。
3.回到君悅的直播秀,不管當天早上如何演,最後他們還是都到了君悅,會到君悅,理論上就是想談,在想談的假設下,他們的策略,要嘛當正,要嘛當副。所以候柯二人在君悅當下的賽局表示如下。
4.正、副,指的是他們的策略,矩陣當中的數字代表所選的策略對應到的報酬。當正的人可以得到10,當副的人可以得到2。當二個人的策略都是正時,就等於談判破局與恭喜賴清德換座位,候跟柯就都回到原點,分別繼續當市長跟網紅,所以報酬皆為0。當候、柯的策略都是副時就是二人再繼續談,談到最後假設正、副各一半的機率,所以期望報酬就如上面矩陣的右下。
5.如果您認同候、柯二人在君悅當天的賽局是長這樣,結局就會落到一正、一副的均衡當中。所以候柯談判破局,跟囚犯困境是無關的,因這個賽局的均衡狀態,不會兩個人都選正,如果他們都是理智的話。如第1.點所說,囚犯困境最主要的精神在於每個人都做對自己做最有利的選擇(策略),結果反而落到一個對自己不利的狀態(均衡)中。在這個賽局,堅持選正並不是對自己有利的選擇(策略),如果二人都理智的話,當給定對方選正的策略下,我的最佳回應是選副。
但事實就是二個人都選了正的策略,如果不是囚犯困境,該怎麼解釋?鍵盤俠事後來看,這樣解釋好像有通:
候、柯二人,把自己是否能夠當選總統視為次要,主要目標是立委選舉。以事後結局來看,國民黨、民眾黨的立委選舉選得都算成功,國民黨成為國會第一大黨,民眾黨成為關鍵第三黨。
但如果當初是候正柯副,或許年輕人想到要出來投候,很多應該就洗洗睡了,民眾黨的不分區能維持跟上屆一樣5席就偷笑。
如果當初是柯正候副,國民黨的基本盤想到要出來投柯,應該很多人腳就麻了,結局很可能民進黨會跟上屆一樣國會過半。
以事後來看,在取得執政權與取得立法院席次,兩者間的重要性衡量,後者大於前者,先以立委選情為主,總統選舉次要。如果這講的通,當副手的報酬就不是2,而是負值,所以落到二個人都選正,才是唯一一個純粹略的Nash均衡,這樣就合理了。
如果這樣唬爛有通,又假設藍白陣營當中每個人都是理智的,當時他們參加君悅大亂鬥是為了談合這個假設就有問題了。會進去君悅,不是為了談合,也不是為了吃排骨飯,更不是為了喝奶茶,反而是要在分手擂台上演自己如何被渣,然後獲取介於藍白中間的中間選民對藍、白政黨的最大支持。