常見的賽局結構,除了囚犯困境、搭便車賽局之外,還有一種稱為「協調賽局」的結構。
在協調賽局中,只要有人做出了選擇,剩下的人全部都會跳到那個選項。而且只要決定了,通常不會被改變,不管這個選擇是好的、或不好的,都離不開「和大家一樣」的穩定狀態。
協調賽局:跟大家一樣,就是最好的選擇
比方說,搭電扶梯時大家都會靠右邊站、將左邊留給快速通行的人。即便知道了電扶梯的正確使用方式是不分左右的,也還是很難改變這個習慣。甚至是在尖峰時間,如果你站在電扶梯的左側停下來不動,馬上就會招致後面人的不爽,被抱怨要你站到右側去,不要在這裡擋路。
還有職場中的加班文化、公務員心態,也都是一種協調賽局的結果。
協調賽局本身並沒有所謂的好與壞,只不過因為存在著「多個」奈許均衡,會落在哪一個奈許均衡上都有可能,當然也有可能最後落在「大家都不希望的選項」上。像是在企業或組織中的習慣,大多是以協調賽局的結構所產生,只要多數人共同擁有約定成俗的習慣,大致上就能預估其它人的行動會是相似的。
這種賽局最大的特色就是:跟著主流走就沒有錯!
職場上的加班文化、做事的流程與方式,都會出現「以前就這樣做」或是「大家都這麼做」的無形約束力,一旦形成穩定的結構後就很難做出改變。在商業場景中,也存在著協調賽局的結構。比方說,成為主流的產品規格,就會吸引消費者接受,然後其它廠商也會靠攏採用相同的規格,即使這個規格未必會是最好的選擇。
面對著這樣的賽局結構,要如何做出改變?
協調賽局的本質,就是和大家一樣。所以要改變不難,也不需要改變賽局的規則;只要當多數人都做出了改變,不用採取任何強制手段,自然就會進入新的穩定狀態。
這讓你想到了什麼?沒錯,像是政治選舉爭取中立或立場沒那麼堅定的族群支持、社群媒體上帶風向,其實都是一種協調賽局的操作。
學習賽局,你可以從囚犯困境、搭便車賽局與協調賽局這三種常見的賽局結構開始。但是,這些都是靜態賽局,在賽局中的所有參與者幾乎都是同時做決定的,沒有時間流的問題,不會有看到別人的決定之後,再來考慮自己要做出什麼決定,所以又稱作同步賽局。
在靜態賽局中,奈許均衡的觀點十分重要,可以說對方會採取什麼樣的行動,大致上可以根據奈許均衡的結果推測出來。但在現實社會中,不論企業或個人決策可能會受到時間因素的影響,而有先後之分,所以又衍生出動態賽局的領域出來。
...
動態賽局,隨著時間經過,賽局發展也會隨之改變
動態賽局,相較於靜態賽局最大的不同,是「時間」的影響。
在靜態賽局中,所有人都是同步做決定的,就像猜拳遊戲,但是在動態賽局中,可能是等你做決定之後,我在看你的決定來選擇該怎麼做?就像下棋;或者是有過一次經驗後,在下一次我就知道該如何做出更好的決定。
換句話說,動態賽局是一種資訊不對稱的遊戲。
隨著時間推進,獲得了新資訊或是有人採取了行動,都會使我們重新評估賽局與做出應對,在動態賽局中有兩種賽局結構,第一種叫做「擴展型賽局」,就像下棋一樣,一位玩家出招之後、另一位玩家再出手;第二種叫做「重複賽局」,就是同樣的賽局一再重複,你怎麼對我、我就怎麼對你,陷入長期的循環。
...
擴展型賽局:你先出招、我再出手
A公司經過長期研發後,新商品在市場上一推出就廣受歡迎,由於沒有競爭對手所以獨占了百分百的市場。B公司看到後,覺得有利可圖,也想切入這個市場分一杯羹。
這時候,B公司該不該進入這個市場呢?A公司又該如何應對呢?
我們將可能的情況列出來並梳理一下脈絡。A公司的應對取決於B公司進入、或不進入市場。對於B公司來說,有兩個選項:進入、不進入。
- 假設B公司最後決定不進入市場,那麼A公司也不會有任何應對行動。
- 假設B公司決定進入市場,那麼A公司有兩個選擇:合作或競爭。
競爭,指的是透過降價、行銷或其他方式,來防堵市占率被B公司搶奪;合作,指的是與B公司簽署合約,以雙方都能認同的方式發展事業,一起把市場做大。
在動態賽局中,因為必須納入時間與判斷順序,所以必須先用「決策樹」的形式來整理出完整的賽局結構,也有人稱之為賽局樹。根據梳理出的脈絡,賽局樹可以繪製成以下的形式:
首先,公司B要決定是否進入市場?如果公司B不進入市場,那麼公司A將不會有任何回應,仍然享有全部的市佔率;如果公司B決定進入市場,那麼公司A將會做出競爭或合作這兩種可能性。
其次,在賽局樹的結構釐清之後,我們要進一步確認在每一個選項組合下的收益,通常困難的地方就在於這裡,不同決策者所做出的評估也可能不同。市場規模會改變、價格也會產生波動,為了讓賽局的評估簡單化,先假設市場規模的總量固定為100,一開始的價格為100,我們可以計算出不同選項組合下的收益:
- 公司B決定不進入市場,公司A維持原本收益為100*100,等於10,000
- 公司B決定進入市場時,若公司A選擇降價20%競爭,但市占率可能會被瓜分30%,所以公司A的收益會是(100*70%)X(100*80%)=5,600,公司B的收益則是(100*30%)*(100*80%)=2,400;
- 公司B決定進入市場時,若公司A選擇合作,能維持原本的價格,但市占率會讓出40%,這時公司A的收益會是(100*60%)X(100)=6,000,公司B的收益會是(100*40%)*(100)=4,000
最後,我們已經將公司A與公司B在可能路徑下的收益整理在賽局樹上,再找出符合奈許均衡的組合
- 當公司B不進入時,公司A的收益是10,000
- 當公司B進入時,公司A採取合作的收益較高是6,000,這時公司B的收益是4,000,也比競爭時的收益來得高。
所以賽局的奈許均衡發生在「公司B進入、公司A選擇合作」的選項組合下。而公司B不進入時,公司A雖然收益更高,但這時賽局並不成立。我想你可以從這個賽局樹看出動態賽局的特性:隨著時間推進,有一方選擇行動之後,會影響另一方所採取的行動。
透過一個簡單的例子,希望讓你理解什麼是動態賽局,以及和靜態賽局有什麼不同。而在真實世界中,動態賽局遠比這個例子複雜得多,資訊不對稱的情況也更為嚴重,像是市場規模、銷售價格的掌握,乃至於合作或競爭可能造成的市占率瓜分與價格變動的評估,都有賴於決策者的經驗與能力決定賽局的走向;而能否獲得某些重要資訊,更可以說是扭轉賽局的關鍵因素。
舉例來說,公司A可能為了完全壟斷市場,透過一些商業手段阻撓公司B進入市場的念頭,讓這個賽局根本就不會開始。這時候公司A所評估的因素,就是阻撓所付出的成本,比起讓公司B進入市場後所損失的代價,哪個比較值得?
當然,公司A也要考量到,公司B的進入有可能將市場規模做大,而且有競爭對手可以激勵自己的進步。這些影響的量化評估都會影響到賽局最佳策略的評估。
另一方面,站在公司B的角度來思考。公司B要進入市場,意圖是要傾全力投入呢?還是試試市場的水溫?或只是為了找出市場的缺口,切入公司A不做、無法做的利基市場呢?這時候,公司B也會先考量到進入市場的報酬與成本相比,到底該不該進入市場?
在確認有利可圖後,也需要考量公司A會對自己進入市場這件事做出什麼樣的回應?如果發現公司A在評估後,認為阻撓公司B進入市場的代價太高、損人不利己時,就會放心地進入市場,甚至是主動與公司A談合作,因為這樣更有可能創造雙贏的局面。
當我們將這些因素都納入動態賽局的考量之中,這個賽局樹就會變得更為複雜;不過,當我們投入心力進行賽局的推估時,將會更清楚整個局面、並且找出不戰而屈人之兵的策略。比起毫無頭緒憑直覺做出決策,納入賽局的思考會有更高的勝算,也會有更好的應對準備面對可能出現的局面。
這部分就牽涉到「貝氏賽局」的範疇,也就是結合動態賽局與貝氏理論的一種賽局,在這裡我就不多談。如果你有興趣,不妨可以上網搜尋相關資料。
在談完擴展型賽局之後,我們來談談另一種動態賽局:重複賽局。
...
重複賽局:一報還一報;以德報德、以直報怨
重複賽局,顧名思義,就是同樣的賽局一再重複,在這種情況下賽局的結構會發生什麼樣的變化?賽局中的參與者又會採取什麼樣的行動策略呢?
在靜態賽局中的囚犯困境,就是以賽局一次就結束為前提下的討論,所以在各懷鬼胎的限制下,雙方都會做出符合奈許均衡的行動,也就是以「認罪」來規避更大的風險;而不會選擇對大家都好的最佳選項,彼此都不認罪。
但是,如果這個賽局會無限重複下去,囚犯在知道對方的選擇之後,還可以再次做出新的選擇,那麼兩個囚犯又會做出什麼樣的選擇呢?彼此都認罪還會是最佳選項嗎?在繼續接下來的內容前,我想請你先思考一下這個問題:如果賽局可以無限重複,你還會選擇認罪嗎?
我先揭曉答案,最後這兩個囚犯都會轉變策略,選擇不認罪而脫離困境。
為什麼會這樣?讓我來告訴你。
當賽局只有一次機會時,如果遭到對方背叛,自己可能就GG了,所以當然也會選擇背叛認罪這個選項。但是,如果賽局還可以重複一次、兩次,不論哪一個囚犯,都會多出一個策略可以使用,那就是「你怎麼對我,我就怎麼對你」
換句話說,如果你敢背叛,我就會讓你好看。
透過這樣的威脅,反而會促成一種合作關係,先共同脫離困境再說。
而且兩個囚犯原本就知道最佳選項,是彼此都不認罪,可以獲得最少的刑期。只是在擔心對方出賣自己,害怕沒辦法討回來的風險之下,即使知道有最佳選項也不會去選,這就是他們的困境。
但是,當這個賽局可以再玩一次時,情況就改變了,兩個囚犯會知道不要背叛比較好,因此而建立起合作關係,這就是重複賽局的特色。在企業競爭與品牌經營上,都存在著這種重複賽局,可以一時欺瞞過對方,但對方也會討回來,所以維持長期關係才是正道。
...
這是幕僚賽局力的最後一篇文章。
關於賽局,可以探討的內容還有很多,也被大量地運用在決策過程中,並且納入了行為經濟學、貝氏理論等基礎,逐漸發展為能透過人工智慧大量計算的優勢,獲得高勝算的決策。不知道你有沒有發現,在動態賽局中,選擇合作並維持長期關係往往都會是最佳策略,對吧?但是,為什麼還有會有人選擇背叛、做出損人不利己的選擇呢?
這是因為人都是有限理性的,並不會在任何時刻都保持著完全理性。
在有限理性的賽局中,我們未必只追求自己的利益;驅使人心的,並非只有金錢和利益,有時更多是情感上的作用。比方說,我們可能會因為選擇和對方合作、讓對方高興,或是獲得對方認同,而感到喜悅和滿足,這些可能會比金錢或利益更被某些人重視。
當然,你也可以說情感上的滿足,也是一種利益。
我不否認這一點,但不同人對於情感滿足的價值量化可能就大不相同,也因為這樣,在某些重視情感作用的人眼中,所謂的最佳選項,在其它人看來就不是這麼合理了,你說對吧?
劉奕酉|鉑澈行銷顧問策略長、企業培訓顧問、暢銷書作者
擁有高科技產業十多年策略行銷與高階幕僚經歷,為台灣少數具有深厚實務背景的商務顧問,專注提供企業與職場工作者在思考、表達與問題解決領域的培訓與顧問服務。同時也是職場生產力作家,多家出版社、社群媒體指定邀稿對象;一年閱讀百本書、寫作百篇以上職場文章,以知識萃取、高效產出與全息圖解而廣受好評。
培訓、講座、專欄、顧問服務邀約,或文章轉載授權請私訊聯繫 (easypresentation2016@gmail.com)