Day 3 如果合作賽局的節果是全體聯盟,則該怎麼分配得到的效用呢?簡介 Shapley Value

更新於 發佈於 閱讀時間約 9 分鐘

上次我們提到了三種常見的賽局,分別是加性賽局、超加性賽局與次加性賽局。其中我們也分析了這三種賽局中的結盟傾向:

  • 加性賽局:要不要合作並無太大差異,因為效用可以完美疊加。
  • 超加性賽局:合作總比不合作好,所以最後容易形成全體聯盟
  • 次加性賽局:單打獨鬥反而比合作好,所以不易出現聯盟。


在一個超加性賽局中,如果所有成員最終通力合作,就會形成「全體聯盟 (Grand Coalition)」。此時,我們獲得的總效用 v(N) 要如何在各玩家之間做分配?本篇要介紹一種廣受重視的分配方法:Shapley Value


Shapley Value :基於邊際貢獻的分配方式


我們從一個假想的超加性賽局出發:

假設有三個專業人士 A, B, C ,各自擁有不同的能力與資源。

單打獨鬥時,因為條件不具備或投入不足,無法產出任何效用

raw-image

若兩人組隊,會有一定程度的專業互補與成本分攤,所以能創造些許價值,但幅度有限:

raw-image

然而,當 三位專業人士全部合作(全體聯盟)時,能夠把彼此專長完全結合,達成更大規模或更深層次的專案,產生 10 的總價值:

raw-image

你可以透過窮舉法很快驗證出此合作賽局屬於超加性賽局,也就是合作比不合作好。


前面提到,當三位專業人士 A,B,C 全部合作時能創造 10 的高額價值;而兩兩合作時只能創造 3 或 4;單打獨鬥更是 0。因此,一旦合作賽局確立了「一起上」最有利,那麼該如何將這 10 的總效用分配給三人,才算「合理」與「公平」?


先來後到的問題

假設我們只看「誰最後加入使得效用增量最高」,就可能出現某些人一毛都拿不到的極端狀況。例如:

首先我們關心以下兩個效用值的話

raw-image

那好像可以做出結論:因為 C 的加入,所以我們這個團隊的效用增加了 7 單位,根據「逆向的使用者付費原則」,我們應該給 C 分配 7 點的 payoff。同理,

raw-image

好像可以做出結論:因為 B 的加入,所以我們這個團隊的效用增加了 3 點,而因此我們應該給 B 分配 3 點。最終可以寫出

raw-image

此時 A 沒分到半毛,他於是很生氣的說「你這個按照進場順序分配根本不公平!如果要這樣算的話,那我以後都最後加入!大家以後都最後加入!」這個發言很有道理,考慮這兩個效用值

raw-image

你可以做出結論:因為 A 的加入,所以這個團隊的效用增加了 6 點,所以你應該要給 A 分配 6 點的效用,而不是零點。


你發現了一個問題,這種根據「邊際貢獻」的分配方式會根據先來後到而產生非常大的不同,進而造成不公平。結論就是:僅以單一路徑或單一增量,去判斷某人「究竟貢獻多少」 往往會失真。



怎麼辦呢?Shapley 先生說了:「那就把所有先來後到的順序都考慮一遍,然後取個平均吧!」

Shapley 先生的建議:「把所有先來後到順序都考慮一遍,然後取平均」


A, B, C 三人,有六種先來後到的順序:

raw-image

(這好像六個平行宇宙)


在第一個順序中: (A,B,C) 代表 A 最早來,C 最晚來

  • A 的邊際貢獻:v({A}) − v(∅) = 0 − 0
  • B 的邊際貢獻:v({A,B}) − v({A}) = 3 − 0 = 3
  • C 的邊際貢獻:v({A,B,C}) − v({A,B}) = 10 − 3 = 7


在第二個順序中:(A, C, B)

  • A 的邊際貢獻:v({A}) − v(∅) = 0 = 0
  • C 的邊際貢獻:v({A,C}) − v({A}) = 3 − 0 = 3
  • B 的邊際貢獻:v({A,B,C}) − v({A,C}) = 10 − 3 = 7


在第三個順序中: (B, A, C)

  • B 的邊際貢獻: v({B}) - v(∅) = 0 - 0 = 0
  • A 的邊際貢獻: v({A,B}) - v({B}) = 3 - 0 = 3
  • C 的邊際貢獻: v({A,B,C}) - v({A,B}) = 10 - 3 = 7


在第四個順序中:(B, C, A)

  • B 的邊際貢獻: v({B}) - v(∅) = 0 - 0 = 0
  • C 的邊際貢獻: v({B,C}) - v({B}) = 4 - 0 = 4
  • A 的邊際貢獻: v({A,B,C}) - v({B,C}) = 10 - 4 = 6


在第五個順序中:(C, A, B)

  • C 的邊際貢獻: v({C}) - v(∅) = 0 - 0 = 0
  • A 的邊際貢獻: v({A,C}) - v({C}) = 3 - 0 = 3
  • B 的邊際貢獻: v({A,B,C}) - v({A,C}) = 10 - 3 = 7


在第六個順序中:(C, B, A)

  • C 的邊際貢獻: v({C}) - v(∅) = 0 - 0 = 0
  • B 的邊際貢獻: v({B,C}) - v({C}) = 4 - 0 = 4
  • A 的邊際貢獻: v({A,B,C}) - v({B,C}) = 10 - 4 = 6


接下來,針對每位玩家分別把邊際貢獻加總後除以 3! = 6:

  • A 的 Shapley Value

- 在六種排列中的貢獻分別為 0,0,3,6,3,6,總和 =18,平均為 18/6=3。

  • B 的 Shapley Value

- 在六種排列中的貢獻分別為 3,7,0,0,7,4,總和 =21,平均為 21/6=3.5。

  • C 的 Shapley Value

- 在六種排列中的貢獻分別為7,3,7,4,0,0,總和 =21,平均為 21/6=3.5。


於是最終的效益分配向量可以寫為:

raw-image

此時三人的分配和正好是 10,完全符合「全體聯盟」的效用,也符合每位玩家在各種可能加入順序中的「平均邊際貢獻」。


簡而言之,Shapley Value 解決了「單一加入順序不公平」的問題,藉由「考慮全部可能順序」再求平均,讓結果更能反映所有人各自的貢獻。


數學上的 Shapley Value 定義


假設有一個合作賽局 G = (N, v) 滿足超可加性,其中 N 中有 n 位成員,而且最後形成全體聯盟(grand coalition)。現在要把總效益 v(N) 分配給 N 中的每個成員:


如同我們剛剛看到的: Shapley Value(夏普利值) 提供了一個經典且被廣泛接受的解法。它的核心思想是:每位玩家最終得到的效用,等於他在「各種可能進場順序」中,對整體聯盟帶來的「邊際貢獻」的平均值。


我們通常會用以下符號來代表一個進場順序:

raw-image

例如

raw-image

分別代表「照順序進場」、「全員反過來進場」以及「某個亂序進場(就看括號裡面數字怎麼排)」。


再給定了一個進場順序 (a_1, a_2,..., a_n) 下,成員 i 的邊際貢獻是這樣計算的:

raw-image
raw-image

於是成員 i 在此順序下的邊際貢獻就是

raw-image

接著,我們就對每個先後順序都計算成員 i 在該順序下的邊際貢獻,取平均即可

raw-image

其中的求和符號要讓 sigma 跑遍所有可能的先後順序,因為成員有 n 為,所以總共有 n! 個邊際貢獻需要計算。此 phi_i (G) 即為成員 i 的 Shapley value。


針對每個成員 i 都計算其 Shapley value 就可以得到在全體聯盟下,最後的效益分配向量:

raw-image


小結與預告


本文先透過排列式定義,直觀詮釋何謂「平均邊際貢獻」。在後續內容中,將會介紹另一種常見的子集合加權公式

raw-image

以及說明這兩種看似不同的計算方式,為何能得到相同結果。


之後我們也會更深入地探討 Shapley Value 的一些性質(效率、對稱性、Dummy Player gets nothing 以及可加性),並理解它為何是唯一同時滿足這些條件的解。


Takeaway

  • 在超加性賽局中,若全體聯盟能帶來最大效用,就必須面對「如何分配」的核心問題。
  • Shapley value 的基本精神為:每位玩家最終得到的效用,等於他在「各種可能進場順序」中,對整體聯盟帶來的「邊際貢獻」的平均值。



Reference

Chalkiadakis, Georgios, Edith Elkind, and Michael Wooldridge. _Computational aspects of cooperative game theory_. Morgan & Claypool Publishers, 2011.

封面縮圖:https://www.chinatimes.com/realtimenews/20200917005156-260408?chdtv

留言
avatar-img
留言分享你的想法!
avatar-img
Cesare切薩雷的沙龍
7會員
22內容數
我的研究興趣是密碼學與應用數學,在這裡分享研究路上的所見所聞。
2025/03/03
我們在 Day 4 時花了大量篇幅講解 Shapley Value 的四大特性:效率性、對稱性、虛擬玩家零收益、可加性。今天要反過來證明說,如果有個效益分配函數滿足這四個特性的話,則這個 f 必定就是 Shapley Value
2025/03/03
我們在 Day 4 時花了大量篇幅講解 Shapley Value 的四大特性:效率性、對稱性、虛擬玩家零收益、可加性。今天要反過來證明說,如果有個效益分配函數滿足這四個特性的話,則這個 f 必定就是 Shapley Value
2025/03/02
在合作賽局理論裡,將「特徵函數」視作「向量」,並把所有賽局形成的集合看作一個「向量空間」,能夠為我們提供許多強而有力的數學工具。例如,我們可以用基底來唯一地表達任意賽局,進一步在此空間進行公設、解概念的分析。
2025/03/02
在合作賽局理論裡,將「特徵函數」視作「向量」,並把所有賽局形成的集合看作一個「向量空間」,能夠為我們提供許多強而有力的數學工具。例如,我們可以用基底來唯一地表達任意賽局,進一步在此空間進行公設、解概念的分析。
2025/02/28
本文介紹三大圖論合作賽局:(1) 最小生成樹遊戲:連接供應端;(2) 最短路徑遊戲:共用路段省成本;(3) Steiner樹遊戲:中繼站增彈性。它們均以「子聯盟最小費用」定義成本分攤,廣泛應用於基礎建設、物流等場域。
2025/02/28
本文介紹三大圖論合作賽局:(1) 最小生成樹遊戲:連接供應端;(2) 最短路徑遊戲:共用路段省成本;(3) Steiner樹遊戲:中繼站增彈性。它們均以「子聯盟最小費用」定義成本分攤,廣泛應用於基礎建設、物流等場域。
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
本案例運用常態近似計算兩家保險自留團體的必要儲備金,證明合併能節省成本,為一個「成本分攤賽局」。再透過合作賽局理論,採 Shapley Value 與核心解,分析利益分配的公平性與穩定性,展現精算與博弈思維的實務價值。
Thumbnail
本案例運用常態近似計算兩家保險自留團體的必要儲備金,證明合併能節省成本,為一個「成本分攤賽局」。再透過合作賽局理論,採 Shapley Value 與核心解,分析利益分配的公平性與穩定性,展現精算與博弈思維的實務價值。
Thumbnail
核心(Core)為合作賽局避免分裂的關鍵。當部分玩家組成次聯盟可獲高效益時,大聯盟便失去穩定性。本文透過三人範例,展示如何以線性規劃方法,找到能滿足所有次聯盟需求的分配,從而確保合作穩固與收益最大化。
Thumbnail
核心(Core)為合作賽局避免分裂的關鍵。當部分玩家組成次聯盟可獲高效益時,大聯盟便失去穩定性。本文透過三人範例,展示如何以線性規劃方法,找到能滿足所有次聯盟需求的分配,從而確保合作穩固與收益最大化。
Thumbnail
Shapley Value 是合作博弈中的公平分配方法,滿足效率、對稱性、沒貢獻的玩家零收益與可加性四大特徵。效率確保總收益被完全分配,對稱性保證貢獻相同的玩家獲得相同分配,沒貢獻的玩家零收益則讓無影響力的玩家獲得 0,可加性確保賽局合併時分配結果也能相加。本文透過數學嚴格證明這些性質
Thumbnail
Shapley Value 是合作博弈中的公平分配方法,滿足效率、對稱性、沒貢獻的玩家零收益與可加性四大特徵。效率確保總收益被完全分配,對稱性保證貢獻相同的玩家獲得相同分配,沒貢獻的玩家零收益則讓無影響力的玩家獲得 0,可加性確保賽局合併時分配結果也能相加。本文透過數學嚴格證明這些性質
Thumbnail
合作賽局理論的核心概念在於玩家之間可以簽訂具有約束力的協議,並藉由聯盟的形成與收益分配機制,達成整體效益最大化。本文以特徵函數遊戲為例,深入淺出地說明合作賽局理論的應用場景,例如區塊鏈治理、企業合併和政治聯盟等。同時,也探討了合作賽局中效用分配問題的重要性。
Thumbnail
合作賽局理論的核心概念在於玩家之間可以簽訂具有約束力的協議,並藉由聯盟的形成與收益分配機制,達成整體效益最大化。本文以特徵函數遊戲為例,深入淺出地說明合作賽局理論的應用場景,例如區塊鏈治理、企業合併和政治聯盟等。同時,也探討了合作賽局中效用分配問題的重要性。
Thumbnail
為甚麼不該偏心報酬率,而是該專注於「本金+絕對金額」 本金加絕對金額,就會讓你在「本多終勝」賽道脫穎而出 本多終勝 當本金越少,想要的絕對金額越高,就得提高報酬率,相對「風險也會提高」 當累積本金越多,同樣報酬率下,獲得的絕對金額卻是高的。
Thumbnail
為甚麼不該偏心報酬率,而是該專注於「本金+絕對金額」 本金加絕對金額,就會讓你在「本多終勝」賽道脫穎而出 本多終勝 當本金越少,想要的絕對金額越高,就得提高報酬率,相對「風險也會提高」 當累積本金越多,同樣報酬率下,獲得的絕對金額卻是高的。
Thumbnail
所有的問題,都是一場賽局! 不論是國家、社會、公司乃至家庭都不會是每天風平浪靜,公主與王子都過著幸福美滿的日子。善用賽局理論,除了可以找到個人最大利益,更可以跳脫玩家角色,綜觀全局改變遊戲規則,在各種場合上創造雙贏。 賽局理論是用來分析雙方的利害關係,分析當事人(決策者)之間的「策略互動」,在交
Thumbnail
所有的問題,都是一場賽局! 不論是國家、社會、公司乃至家庭都不會是每天風平浪靜,公主與王子都過著幸福美滿的日子。善用賽局理論,除了可以找到個人最大利益,更可以跳脫玩家角色,綜觀全局改變遊戲規則,在各種場合上創造雙贏。 賽局理論是用來分析雙方的利害關係,分析當事人(決策者)之間的「策略互動」,在交
Thumbnail
柏拉圖效率、優勢策略和奈許均衡,是賽局理論中三個基本概念 舉例來說如果兩個攤販事先商量好分散,以馬路的中間為界,在右側的中間與左側的中間分別擺攤,兩家平等賺錢,還可以確保消費者的購物距離是最短。而這種方法稱為"柏拉圖改善"在不傷害任何人的利益同時,還能使至少一人的境遇變得更好。如果一個局面已經沒有
Thumbnail
柏拉圖效率、優勢策略和奈許均衡,是賽局理論中三個基本概念 舉例來說如果兩個攤販事先商量好分散,以馬路的中間為界,在右側的中間與左側的中間分別擺攤,兩家平等賺錢,還可以確保消費者的購物距離是最短。而這種方法稱為"柏拉圖改善"在不傷害任何人的利益同時,還能使至少一人的境遇變得更好。如果一個局面已經沒有
Thumbnail
分論決定客戶關係的因素有四: ①客戶組合管理-如何選擇有價值的關係及相關的管理原則。 市場層級的客戶組合管理-客戶組合中的個別客戶價值就等於是整個客戶組合價值的平均值。 團體層級的客戶組合管理 個別層級的客戶組合管理   ②價值定位-客戶購買某種商品或服務時,通常不是為了產品本身最終的用
Thumbnail
分論決定客戶關係的因素有四: ①客戶組合管理-如何選擇有價值的關係及相關的管理原則。 市場層級的客戶組合管理-客戶組合中的個別客戶價值就等於是整個客戶組合價值的平均值。 團體層級的客戶組合管理 個別層級的客戶組合管理   ②價值定位-客戶購買某種商品或服務時,通常不是為了產品本身最終的用
Thumbnail
當風險作為報酬的前提,試著分散風險是一種合理的做法。 在風險與報酬之間的平衡,已是老生常談。 然而分散風險對於報酬會有怎樣的影響?
Thumbnail
當風險作為報酬的前提,試著分散風險是一種合理的做法。 在風險與報酬之間的平衡,已是老生常談。 然而分散風險對於報酬會有怎樣的影響?
Thumbnail
 你和朋友投資開公司,說好了生意獲利達到預期目標就開始分利,可是,一段時間後,公司生意尚未達到預期,你的朋友卻說要結束公司,提前拿回資金,這時候,應該要怎麼分配公司所得才算公平呢?如果,你和你的朋友無法達成協議,也許可以請個數字人為你們評估未來吧!只是,數字人是怎麼分析未來的,大家一定要搞清楚喔!
Thumbnail
 你和朋友投資開公司,說好了生意獲利達到預期目標就開始分利,可是,一段時間後,公司生意尚未達到預期,你的朋友卻說要結束公司,提前拿回資金,這時候,應該要怎麼分配公司所得才算公平呢?如果,你和你的朋友無法達成協議,也許可以請個數字人為你們評估未來吧!只是,數字人是怎麼分析未來的,大家一定要搞清楚喔!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News