"囚徒困境"最優解

2024/01/06閱讀時間約 1 分鐘

賽局理論的"囚徒困境":

兩個一起犯案的囚徒, 如果能夠堅持都不認罪(信任同伴), 警方查無人證物證, 雙方都會無罪獲釋, 瓜分贓款(3分).

如果一方不認罪(信任同伴), 另一方認罪(背叛同伴), 不認罪的一方會被判重刑(0分), 認罪的一方可被豁免釋放, 獨得贓款(5分).

如果雙方都坦白認罪(背叛同伴), 雙方都會被判輕刑(1分).


要自私自利, 為非作歹的人去信任同伴, 似乎違反了本性, 所以成為了困境. 但這種困境實際上存在於所有交易協商之中(在自利與互利的矛盾中達到雙贏). 所以, 最好的長期策略(得分最多)是什麼?

社會科學家Robert Axelrod要學生設計成電腦遊戲程式, 來找出最優解.


學生提出了數十種程式對策, 大體上可分為兩組: 善意組(信任優先)與惡意組(背叛優先). 細節上不一樣, 極端的如完全寬恕(被背叛後也總是信任)與完全不寬恕(背叛一次就永遠不信任).

乍看之下, 似乎選擇背叛同伴是最有利的. 總是得分, 永遠不會失分.

但是這數十種對策經過數百次的電腦運算對陣, 產生了積分的排名, 善意組囊括了前十名.

第一名的善意策略也是最簡單的: 信任優先, 但如果對方背叛, 下一次我方也不信任對方, 直到對方改變(以其人之道還治其人之身).


名列前茅的策略有三項共同特性:

1. 善意(信任優先)

2. 寬恕(對方改變, 我也改變)

3. 立即報復(不當爛好人, 至少要求對方說清楚, 絕不容許假裝沒事)


由於現實中可能會有一些突變 (溝通出差錯而造成的假性背叛), 有人提出較寬容的策略: 對方背叛兩次之後, 我方才背叛. 但這個策略積分不高.

社會科學家計算之後提出最優解: 信任優先, 立即寬恕與報復, 但每十次報復只執行九次, 一次忽略(主動寬恕).


這個解法揭露了人性的黑暗與希望...

    1會員
    69內容數
    留言0
    查看全部
    發表第一個留言支持創作者!