《信任的演化》下一步要合作還是背叛?從遊戲中認識賽局

2022/01/29閱讀時間約 4 分鐘

介紹

《信任的演化》(The Evolution of Trust)是一款小遊戲,簡單表現人們如何合作,遊戲首先提出一個問題:
如果對方合作,我合作可以+2枚(付出1、得到3)硬幣,我欺騙可以+3枚硬幣;如果對方欺騙,我合作會-1枚硬幣,我欺騙則沒損失。這樣算起來,欺騙是我更好的選擇。
只玩一次選欺騙更有利,但長期互動就不同了,這次欺騙對方,或許下次對方就反制,讓你得不到好處。遊戲介紹五種策略:
遊戲展示五種角色兩兩重複對決的結果。後續加入演化機制,每回淘汰輸家、繁衍贏家,過程中策略組合會如何演變呢?
影響信任的因素,還有互動次數、獎勵、誤解機率。後期加入三種策略,或許可以處理誤解情形:
以下是我的操作心得,建議先體驗過遊戲再往下讀!

沙盒模式

遊戲中有沙盒模式,可以調整條件,探索演化的結果。
先參考囚徒困境的定義:
囚徒困境賽局定義為兩個參與者的賽局,各方可以「合作」(C-cooperate)或「背叛」 (D-defect)。如果雙方都合作,都可以獲得「獎勵」(R-Reward)。如果背叛,就會得到懲罰(P-Punishment)。如果一方合作,可是對方背叛,第一方會得到「笨蛋」(S-Sucker), 另外一方則會得到「誘惑」(T-Temptation)。收穫的順序是T>R>P>S,而且R>(T + S)/2。
──《合作的競化》P249

實驗一:不同策略,面對誤解機率的表現

玩家組成:模仿貓25/牛文聰25/模仿咪25/少根筋25
報酬:預設
規則:10步、5位、錯誤為操作變因
只操作一次。
以分數高到低排序:
這個實驗針對寬容度,檢視何種策略較能寬容偶爾背叛、恢復合作。
模仿咪連續遭背叛二次才會報復,自然較不易落入互相報復的陷阱,牛文聰只要遇到一次背叛,就會直接背叛到底,沒有恢復的可能,因此最低分。少根筋為什麼表現這麼好?
少根筋的策略是,若對方背叛,就改變自己的決策,否則維持不變。實際畫出來後,我發現少根筋處理誤解非常快,過兩步就能恢復到雙贏。我模擬了發生兩次誤會的狀況,模仿貓可能恢復雙贏,也可能變成雙輸,而少根筋仍輕鬆回到雙贏,自然能領先。
我直覺認為模仿貓比少根筋更聰明、表現更好,但事實不是如此。少根筋面對同伴時,正常情形下會達成雙贏,且處理誤解的速度很快。當然,還是要看對手的策略如何,少根筋若遇上黑到底,有長達1/2的時間會遭到剝削。

計算:福爾摩星兒、少根筋互動過程

從實驗一的結果,我覺得少根筋的機制很有趣,挑了變化較多的福爾摩星兒當對手,計算一對一互動。福爾摩星兒的策略,在前四局會先合作、背叛、合作、合作,後續看對方前四局反應,若對方背叛過,則用模仿貓模式,否則用黑到底模式壓榨對方。

實驗二:獎勵的影響

玩家組成:黑到底13、福爾摩星兒12
報酬:操作變因
規則:10步、5位、錯誤0%
實驗二玩家配置
預設報酬的條件下,福爾摩星兒會獲勝,因為它在同類之間得到的分數夠多,能夠蓋過黑到底占到的便宜。
在隨意嘗試中,我發現有些獎勵的配置,會變成黑到底獲勝,例如「雙贏+1/+1、贏輸+3/-1、雙輸0/0」,但這個配置不符合囚徒困境的定義。
T>R>P>S,而且R>(T + S)/2
是否可能符合囚徒困境的定義,又製造出反轉的結果呢?開始分析:
推導的結果,s小於等於-3,或p等於1,就能滿足囚徒困境,又讓賽局翻轉,使黑到底勝利。可找到「雙贏+1/+1、贏輸+3/-3、雙輸0/0」、「雙贏+1/+1、贏輸+3/-1、雙輸+1/+1」等組合符合條件。
改變外在誘因,也會讓環境變得不同。

多次遊戲

嘗試玩出最低分、最高分:
思考得高分習慣了,要拿低分思維都要逆著來,有一點難。
在這裡拿到最高分、最低分也沒那麼有用,因為對手已經用帽子告訴你它的策略了,可以針對它作出反應。真正在博弈時,大概無法知道對方策略。

結論與感想

遊戲中的總結:
若讀者玩過遊戲,應該能感受到「模仿貓」的強大,它叫做以牙還牙。《合作的競化》中解釋,以牙還牙的長處是:善良(不主動背叛之意)、報復、寬容、明確清晰。
它的善良避免陷入不必要的麻煩的困境。它的報復嚇阻對方在任何時間堅持嘗試背叛。它的寬容有助於恢復相互合作。它的清晰度讓對方容易理解自己,從而促進長期的合作。
──《合作的競化》P83
「模仿咪」稱為以牙還二牙,是以牙還牙的變形。
想維持長期雙贏,總是合作(紅嬰仔)並不是好的策略,除了友善外,也要有能力報復,對方才不敢隨意出手佔便宜,形成互相牽制。

資料來源

  • 《信任的演化》遊戲連結
  • 《合作的競化》羅伯特.艾瑟羅德(Robert Axelrod)著
為什麼會看到廣告
43會員
42內容數
在這裡我會分享閱讀心得、書單。
留言0
查看全部
發表第一個留言支持創作者!