Day 5 Shapley Value:排列式與子集合加權式

更新於 發佈於 閱讀時間約 6 分鐘

簡要回顧:「排列式」的 Shapley Value


在 Day 3 與 Day 4,我們已經討論了 Shapley Value 的基礎定義,以及它所滿足的四大特徵(效率性、對稱性、沒貢獻者零收益、可加性)。

這裡先簡要回顧「排列式(Permutation)」的 Shapley Value。


令 N = {1, 2, ..., n} 為玩家(成員)的集合

特徵函數為 v 且 v(∅)=0

並假設此合作賽局為超可加賽局,且最後會形成全體聯盟


對於玩家 i ,排列式(Permutation)定義的 Shapley Value 為:

raw-image

Day4 中以介紹的四大特徵

效率性:

raw-image

對稱性:若玩家 i 與玩家 j 為對稱,則

raw-image

沒貢獻者零收益:若 i 為沒貢獻者(無論加入何種子集合都不改變該子集合的效用),則

raw-image

最後還有可加性:若 G1 與 G2 為兩個超可加遊戲且賽局最後形成全體聯盟,且 G 上的特徵函數為 G1 與 G2 的特徵函數的和,則

raw-image

子集合加權式的 Shapley Value

雖然「排列式」定義很直觀,但在計算上常可使用另一種 子集合加權 的想法來簡化或理解。以下示範一個四人賽局的做法,再給出一般化公式。


四人賽局的舉例

令玩家集合為 N = {A, B, C, D},並設定特徵函數 v 。假設此為超加性合作賽局且最後結果玩家組成全體聯盟。

我們來專注計算分配給 A 的效用該是多少,根據 Shapley Value 的精神,我們應該要把玩家 A 在所有可能的順序下的邊際效用算出來取平均。


注意到,因為要談「 A 的加入」,所以得先確定 A 原本不在該聯盟中。也就是 A 只能加入以下八種聯盟並造成邊際貢獻:

raw-image

以空集合為例,邊際貢獻是

raw-image

哪種排列會「觸發」A 對空集合的邊際貢獻?

答案是那些把 A 放在第一位(在空集合後面)的排列:

raw-image

共有 3! = 6 種,因為一旦固定 A 為第一位,B, C, D 三人可以任意排列。


所以在「所有可能的先後順序」中, A 先進場(前面是空集合)的邊際貢獻會被算到 6 次,也就對應到上面列舉的這六種。

最後再算平均的時候,這個 A 對空集合的邊際貢獻就要算六次

raw-image

好,接著來看加入 {B} 的邊際貢獻,以及「觸發排列」的個數:

當聯盟為 {B} 時,A 的邊際貢獻會是

raw-image

那麼,有幾種排列能讓這個邊際貢獻被「觸發」?

答案是我們需要讓 B 在 A 的前面,然後 C 與 D 自然就會在 A 的後面:

raw-image

那其實熟悉排列組合的讀者就知道,這個可以用以下乘法原理進行計數:

raw-image

因此此邊際貢獻會在這兩個排列裡出現,所以在最後算平均的時候,這個 A 對 {B} 的邊際貢獻要算兩次。


以此類推,現在我們考慮玩家 A 對某不含 A 的聯盟 S 的邊際貢獻,並考慮他要被算幾次:

首先查閱特徵函數得值,得到

raw-image

有幾種排列能讓這個邊際貢獻被「觸發」?答案跟上面一樣,當 S 的元素出現在 A 前面時:

raw-image

根據排列組合的乘法原理,這樣的排列總共會有

raw-image

於是,我們就知道 Shapley Value 應該是這樣計算:

raw-image

其中前面的 1/n! 是取平均的分母。


子集合加權式 Shapley Value 之一般公式

將以上想法一般化,並重新寫可以得到:


令玩家集合為 N ,特徵函數為 v ,並假設此賽局為超加性賽局且最後形成全體聯盟。則玩家 i 的 Shapley Value 也可以由以下公式求得

raw-image

這個公式就是 子集合加權式 定義的 Shapley Value。

兩者等價的數學證明

最後,我們要嚴謹地證明:「排列式」與「子集合加權式」的 Shapley Value 其實是同一件事,計算結果必然一致。


我們先前介紹了排序式的 Shapley Value 公式

raw-image

P 代表 Permutation(排列)

然後上一節介紹了子集合加權式的 Shapley Value 公式

raw-image

S 代表 Subset (子集合)


現在我們要說:這兩個公式算出來真的是一樣的!

(證明並不困難)

我們從排序式的 Shapley Value 出發,注意到

raw-image

中的排列 sigma 會跑遍所有的排列順序。因此如果固定一個不含玩家 i 的集合 S ,則總是會有一些排列 sigma 滿足「在該排列下,i 前面的先行者等於 S」

raw-image

我們於是把求和符號改寫:

raw-image

對於每個在左邊被算到的排序 sigma ,令 S 為在該排列下的玩家 i 前面的先行者,則這個 sigma 就會被右邊的求和符號算到;對於每個在右邊的排序 sigma ,總是會在左邊被算到,因為左邊算了所有可能的排序 sigma。


於是我們就可以寫出

raw-image

現在,被運算的

raw-image

實際上與排序 sigma 無關,因此可以當作常數提出

raw-image

現在我們來計算

raw-image

其實他的意思就是問說有多少個排序 sigma 會滿足

raw-image

這意思相當於有多少個排序 sigma 會滿足以下的先後順序

raw-image

那根據乘法原理,答案是

raw-image

因此

raw-image

而最後可以寫出:

raw-image

證明完畢


Takeaway

  • 排序式的 Shapley Value 公式
raw-image
  • 子集合加權式的 Shapley Value 公式
raw-image
  • 兩種定義,可說是從不同的角度落實了 Shapley Value 的「公平分配」理念。


Reference

Branzei, Rodica, Dinko Dimitrov, and Stef Tijs. _Models in cooperative game theory_. Vol. 556. Springer Science & Business Media, 2008.









avatar-img
6會員
12內容數
我的研究興趣是密碼學與應用數學,在這裡分享研究路上的所見所聞。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Cesare切薩雷的沙龍 的其他內容
Shapley Value 是合作博弈中的公平分配方法,滿足效率、對稱性、沒貢獻的玩家零收益與可加性四大特徵。效率確保總收益被完全分配,對稱性保證貢獻相同的玩家獲得相同分配,沒貢獻的玩家零收益則讓無影響力的玩家獲得 0,可加性確保賽局合併時分配結果也能相加。本文透過數學嚴格證明這些性質
本篇討論超加性賽局中,全體聯盟如何分配總效用。Shapley Value 提出以考量所有進場順序之平均邊際貢獻,藉由取平均使每位成員獲得合理份額,避免單一路徑造成的不公平分配,並促進合作收益更合理化。
本文探討合作賽局理論中的聯盟結構與效益分配問題,並介紹加性賽局、超加性賽局和次加性賽局三種類型,分析不同賽局特性下聯盟行為的趨勢。
合作賽局理論的核心概念在於玩家之間可以簽訂具有約束力的協議,並藉由聯盟的形成與收益分配機制,達成整體效益最大化。本文以特徵函數遊戲為例,深入淺出地說明合作賽局理論的應用場景,例如區塊鏈治理、企業合併和政治聯盟等。同時,也探討了合作賽局中效用分配問題的重要性。
Shapley Value 是合作博弈中的公平分配方法,滿足效率、對稱性、沒貢獻的玩家零收益與可加性四大特徵。效率確保總收益被完全分配,對稱性保證貢獻相同的玩家獲得相同分配,沒貢獻的玩家零收益則讓無影響力的玩家獲得 0,可加性確保賽局合併時分配結果也能相加。本文透過數學嚴格證明這些性質
本篇討論超加性賽局中,全體聯盟如何分配總效用。Shapley Value 提出以考量所有進場順序之平均邊際貢獻,藉由取平均使每位成員獲得合理份額,避免單一路徑造成的不公平分配,並促進合作收益更合理化。
本文探討合作賽局理論中的聯盟結構與效益分配問題,並介紹加性賽局、超加性賽局和次加性賽局三種類型,分析不同賽局特性下聯盟行為的趨勢。
合作賽局理論的核心概念在於玩家之間可以簽訂具有約束力的協議,並藉由聯盟的形成與收益分配機制,達成整體效益最大化。本文以特徵函數遊戲為例,深入淺出地說明合作賽局理論的應用場景,例如區塊鏈治理、企業合併和政治聯盟等。同時,也探討了合作賽局中效用分配問題的重要性。
你可能也想看
Google News 追蹤
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
Thumbnail
上篇我們學到價格走勢的高低點可以當作壓力與支撐,但哪個位置的壓力與支撐比較重要? 俗話說:新手看價、老手看量。這篇文章討論了成交量對於評估股市的重要性,並提出了觀察成交量變化的新規則。
Thumbnail
積聚/派送,資金流量指標,衡成交量指標和交易量是用於協助技術分析師評估股票或其他金融資產的市場走勢和價格動向的重要工具。
Thumbnail
本文介紹瞭如何利用正報酬長尾和獲利曲線正偏兩種方式來設計交易策略,以達到正期望值。同時提到了在停損停利設計上的一些要點,以及如何透過回測資料進行調整。
Thumbnail
《無痛買單》一書作者下寬和透過細膩觀察,將定價策略分成24種,在本篇文章中,我將重點放在「價格客製」與「出價競標」這兩種策略上。 首先,下寬和給「價格客製」策略的定義是:基於媒合買賣雙方需求和供給的一種智慧型定價方式,簡單來說,就是「因地制宜」的定價方式。他在書上所舉的例子就是像在富士山頂或滑雪場
Thumbnail
這篇文章,會帶著大家複習以前學過的FSM+DP框架, 並且以有限狀態機 + DP狀態轉移的概念為核心, 貫穿一些相關聯最佳股票買賣系列的題目, 透過框架複現來幫助讀者理解這個實用的演算法框架。 基本的FSM + DP 框架,配合交易邏輯。 針對每一天,其實歸根究柢只有兩種狀態。 第一種
Thumbnail
一般常見的時間架構分成三個:趨勢級別、分析級別、進場級別。 趨勢級別 週線 or 日線,目的是為了確認整體市場的方向,以及關鍵流動性區域(支撐、壓力位) 分析級別 4H or 1H,目的是確認市場當前方向、公允價值缺口、訂單塊、流動性區域、高期望值交易區域,需要花較多時間來分析。 進場級別
什麼叫均值回歸,要如何搭配股市操作,可以參考作者的方法。
Thumbnail
什麼是「Rule-based bidding」? 基於規則的競價(Rule-Based Bidding),是一種以RoAS為目標,利用機器學習演算法將一系列影響效果的參數(時間、受眾群體、展示位置等)考慮在內,並依據大規模數據幫助賣家更準確地出價的功能。 為什麼Rule-based biddi
Thumbnail
透過探討指數級增長、常態分布與冪律分布在選擇行業時的應用,強調了分析邊際成本和市場分布特性的重要性。作者挑戰傳統追隨者思維,提倡創新和尋找獨特優勢,並透過服務業例子展示如何應用這些底層邏輯進行前瞻性決策,幫助讀者識別增長機會,制定成功策略。
Thumbnail
Standard Deviation Projections(SDP)是一項相當好用的價位計算技巧,利用PO3的操縱段來當作基數,計算預期價格出現阻力或扭轉的位置。
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
Thumbnail
上篇我們學到價格走勢的高低點可以當作壓力與支撐,但哪個位置的壓力與支撐比較重要? 俗話說:新手看價、老手看量。這篇文章討論了成交量對於評估股市的重要性,並提出了觀察成交量變化的新規則。
Thumbnail
積聚/派送,資金流量指標,衡成交量指標和交易量是用於協助技術分析師評估股票或其他金融資產的市場走勢和價格動向的重要工具。
Thumbnail
本文介紹瞭如何利用正報酬長尾和獲利曲線正偏兩種方式來設計交易策略,以達到正期望值。同時提到了在停損停利設計上的一些要點,以及如何透過回測資料進行調整。
Thumbnail
《無痛買單》一書作者下寬和透過細膩觀察,將定價策略分成24種,在本篇文章中,我將重點放在「價格客製」與「出價競標」這兩種策略上。 首先,下寬和給「價格客製」策略的定義是:基於媒合買賣雙方需求和供給的一種智慧型定價方式,簡單來說,就是「因地制宜」的定價方式。他在書上所舉的例子就是像在富士山頂或滑雪場
Thumbnail
這篇文章,會帶著大家複習以前學過的FSM+DP框架, 並且以有限狀態機 + DP狀態轉移的概念為核心, 貫穿一些相關聯最佳股票買賣系列的題目, 透過框架複現來幫助讀者理解這個實用的演算法框架。 基本的FSM + DP 框架,配合交易邏輯。 針對每一天,其實歸根究柢只有兩種狀態。 第一種
Thumbnail
一般常見的時間架構分成三個:趨勢級別、分析級別、進場級別。 趨勢級別 週線 or 日線,目的是為了確認整體市場的方向,以及關鍵流動性區域(支撐、壓力位) 分析級別 4H or 1H,目的是確認市場當前方向、公允價值缺口、訂單塊、流動性區域、高期望值交易區域,需要花較多時間來分析。 進場級別
什麼叫均值回歸,要如何搭配股市操作,可以參考作者的方法。
Thumbnail
什麼是「Rule-based bidding」? 基於規則的競價(Rule-Based Bidding),是一種以RoAS為目標,利用機器學習演算法將一系列影響效果的參數(時間、受眾群體、展示位置等)考慮在內,並依據大規模數據幫助賣家更準確地出價的功能。 為什麼Rule-based biddi
Thumbnail
透過探討指數級增長、常態分布與冪律分布在選擇行業時的應用,強調了分析邊際成本和市場分布特性的重要性。作者挑戰傳統追隨者思維,提倡創新和尋找獨特優勢,並透過服務業例子展示如何應用這些底層邏輯進行前瞻性決策,幫助讀者識別增長機會,制定成功策略。
Thumbnail
Standard Deviation Projections(SDP)是一項相當好用的價位計算技巧,利用PO3的操縱段來當作基數,計算預期價格出現阻力或扭轉的位置。