多模型思維

蔡孝祺-avatar-img
發佈於查理蒙格 個房間
更新於 發佈於 閱讀時間約 51 分鐘

多模型思維:天才的32個思考策略

The Model Thinker:What You Need to Know to Make Data Work for You

Scott E. Page  2021 天下文化

分類:論說--實用 

★★★★★

 

一句話:

如何運用多模型的方法處理現代社會的複雜問題。

 

重要字句:

模型是使用數學和圖表來呈現的形式結構,能幫助我們了解世界。所有模型都必需具備能「溝通」且「可處理」的特性。

多模型思維的核心思想為藉由不同的邏輯框架來產生智慧,可以讓我們發現各個模型的盲點。

本書的模型涵蓋三類:簡化現實世界、數學模型類比、用來探索的虛擬架構。

模型的功能REDCAPE包含推理、解釋、策劃、溝通、行動、預測、探索。實務上常因為多種目的而使用模型。

 

摘要:

多模型思維

要成為智者,腦中隨時都要有模型,且生活中不論是直接或間接經驗,都須整理到各個模型的架構上。-- Charlie Munger

 

多模型思維的核心思想為藉由不同的邏輯框架來產生智慧。不同模型強調不同的因果關係,讓我們發現各個模型的盲點,運用多模型可以察覺各種複雜因果過程之間的重疊與互動關係。

不使用模型思考容易陷入經驗法則的誤判和認知缺陷。


模型的三項共同特徵:

  • 簡化:將現實抽象化或憑空建構,去除不必要的細節。不論何種模型,都必須簡單到我們得以運用邏輯來處理。
  • 形式化:形式化並使用精確定義,利用數學算式、機率、優先順序,而非文字敘述,讓我們得以運用邏輯來處理問題。
  • 所有的模型都是錯的:所有模型都有簡化而造成的錯誤。

 

智慧層級結構wisdom hierarchy

  • 資料data:未經整理和組織的原始事件、經驗和現象。
  • 資訊information:將資料命名並區分到不同類別。
  • 知識knowledge:瞭解相關性、因果和邏輯關係,而知識常以模型的形式呈現。這些模型可以用來解釋和預測現象。
  • 智慧wisdom:瞭解並運用相關知識的能力,包含選取正確或最佳的模型來做出最佳決策、比較不同模型的優劣

 

模型的特性:

  • 必須要能以數學或程式碼等正式語言寫下模型。
  • 模型是以條件形式進行推論,大部分理論都只有在特定條件下才成立,所以模型的重要價值之一是可以揭露結果背後的條件。
  • 幫助我們進行直觀的判斷和探索各種想法。

 

模型的類型:

  • 具體化方法embodiment approach:簡化現實世界但強調真實。納入重要因素並剔除或整合非必要的屬性,例如生態林地、交通系統、氣候模型、大腦模型。
  • 類比方法analogy approach:用數學模型類比來抽象化現實狀態。例如使用疾病傳染模型來模擬犯罪擴散、將乳牛假設為球型來計算牛皮面積。
  • 另類實境法alternative reality approach:用來探索的虛擬架構。可以進行分析和計算的實驗場所。

 

模型精細度問題:

  • 大模型:推理、解釋、溝通和探索,需要把問題簡化,簡化問題才便於使用邏輯來解釋現象。
  • 精細模型:預測、策劃和行動,需要高擬真模型,善用大數據。
  • 增加分類數量,可以減少分類誤差,但會增加每個分類中估值誤差發生的機率(平均值的「變異數」增加)。並且會過度擬合資料,造成預測上的困難。
  • 分類數少的話可能將不同平均值的資料放到同一個分類,會增加分類誤差的機率,但分類中的資料數變多可以減少估值誤差。

分類category

  • 資料維度限制了可能產生的模型數量,每個子屬性必須要與預測結果相關,且不能和其它屬性相關,才能建構更多獨立模型。
  • 就算額外模型的準確率較低,只要分類方法相異就應該加入。

模型的功能:REDCAPE

推理reason:明辨條件並推論邏輯意義。

  • 建構模型會找出最重要的實體或相關因素,然後描述這些因素如何互動整合,藉此推導因果關係和原因。
  • 利用邏輯可以精確推導出預期的結果、甚至預期外的關係,並發現直覺結果隱含的條件。
  • 邏輯也可以用來解釋悖論。
  • 邏輯可以推理出事件的成立條件。

 

解釋explain:為經驗現象提供可驗證的解釋。

  • 模型可以解釋經驗現象、型態、數值和數值變化。
  • 社會現象比起物理現象更加難解釋,因為社會決策者異質性高、以小群體方式互動且不遵循固定規則、人具備思考能力會受到環境影響而做出反應。

 

策劃design:選擇制度、政策和制訂方向。

  • 提供架構讓我們思考「選擇」的蘊含,以便協助規劃制度。

 

溝通communicate:連結知識和理解。

  • 建立通用表達方式來改善溝通成效。
  • 針對抽象概念、重要特徵和特徵關係做出正式定義以便於溝通。

 

行動act:指導政策選擇和策略行動。

  • 組織決策者面對重大行動時,都需要根據和資料緊密連結的模型來做決定。
  • 當執行人生重大行動時,我們也應該藉助模型思考。

 

預測predict:對未來及未知現象做出數值和分類預測。

  • 預測和解釋是兩碼事,模型(例如深度學習演算法)可以只進行預測但是不給予解釋,也有模型(例如板塊模型)可以解釋卻無法用來預測。
  • 預測時通常模型越大越好,解釋時則偏好小模型。

 

探索explore:探討各種可能和假設。

  • 我們可以使用模型探索假設性的問題和虛構的情境,或進行跨領域的研究。

 

建構人群行為模型

建構人群模型的挑戰:人人各自相異、易受社會影響、容易犯錯、目標強烈、擅長學習而適應力強、具有能動性。我們必須精心挑選部分特性和假設帶入模型,不然只會製造複雜和混亂。要納入這些特徵時需要考量人的這種行為有沒有獨立性將差異互相抵消、有沒有認知偏誤造成的系統偏差、渴望和目標是什麼、學習的狀況會不會隨情境改變等等。

 

理性決策模型Rational-actor model

  • 定義所有可能行動的數學化效用函數或報酬函數,藉此呈現個人偏好,並假設個人會選擇最大化函數值的行動。適用的行動包含報酬僅取決於個人行動的「決定」,或是報酬同時取決於其他參與者行動的「賽局」。
  • 我們可以使用資料數據來評估函數、推導最佳行動,也可以改變參數值來討論假設性的問題。
  • 理性決策模型在預測人類行為上較為困難,而在溝通、評估行動和策劃政策方面成效較佳。
  • 若要呈現偏好,須符合完備性、遞移性、獨立性和連續性。雖然人類的行為常為反獨立性和遞移性。
  • 支持理性選擇的論點:人的行為「正如同」就是在取得最佳化的結果。重複情境下,學習會讓行為趨近理性。決定重大事務時,會蒐集資料和仔細思考。大多數效用函數只有唯一的最佳行為,可以簡化分析工作。確保內部的一致性。理性可以提供人們認知能力的上限基準。

 

心理偏誤

  • 現狀偏誤;忽略基本率;損失趨避(面對收益會風險趨避,面對損失卻風險尋求);雙曲折現(認為近期未來的折現,遠遠大於遠其未來的折現)。理性決策模型視需要應該加入損失趨避和雙曲折現的假設。

 

規則為本模型

  • 假設人們有特定的行為,以行為做為基礎,而最佳化為本的模型建立在偏好和報酬基礎上。
  • 規則可以來自簡單固定規則或適應規則。

 

模型產生的可能結果有平衡、循環、隨機、複雜。產生平衡與循環的模型,會創造一個穩定環境,可以期望人們能夠學習,也就是不會有人永遠採取次佳行動。如果產生隨機結果,個人可能就無法學習。如果產生複雜狀態,人們就不可能做出最佳反應,比較可能使用簡單規則來應對複雜。

盧卡斯批判:根據過去人們的行為資料做出評估的模型,會因為改變政策或情境讓人的行為反應受影響,而變得不準確。模型必須考量人們對政策或情境改變做出反應的影響。

 

常態分布:鐘型曲線

分布是使用數學方法將資料展現成數值上或分類上的機率分布,藉此捕捉變異量variation(同一類型中的差異,用來測量分布的離散程度)和多樣性diversity(不同類型間的差異)。

變異數是各資料點到平均值的距離平方的平均值,而標準差等於變異數的平方根。常態分布normal distribution是以平均值為中心,呈現對稱分布。平均值正負三個標準差包含99%的資料點。

raw-image

中央極限定理:即使原始變量不是常態分布,從一個母群體隨機抽取獨立樣本加總,當樣本數夠大時,分布會近似常態分布。前提是所有隨機變數必須獨立、變異數大小有限、且沒有任何小群組貢獻大部分的變異數。應用:假設身高是一百多個基因貢獻的加總結果,且假設基因有獨立的貢獻,則身高將會呈現常態分布。

極端事件幾乎都發生在小群體中:根據平方根法則,平均標準差會以樣本數的平方根為反比地減少。所以在愈小的群體,愈容易看到極端事件。例如小學校的成績表現會比大學校優異;人口稀少的國家癌症發生率較高。

顯著性檢定:如果觀測到的實際平均值落在假設平均值的兩個標準差之外,社會科學家就會認定這個假設是錯的。

如果量值並非以獨立隨機變數的加總或平均呈現,而是相乘的結果,會產生對數常態分布(只包含正數,擁有長尾型態)。注意對數常態分布不是下面提到的冪律分布。

 

冪律分布:長尾分布

非獨立且通常為正回饋的資料,會產生包含極端大數值事件的長尾分布power-law distribution。

冪律分布中,事件發生機率和事件大小的負指數成正比p(x) = Cx-a。a可以決定尾巴長度,a大表示尾部細,大事件很罕見。例如地震規模的大小近似於指數接近2的冪律分布。指數為2的分布稱為Zipf distribution,事件排名乘以事件大小或發生機率會等於常數

raw-image

偏好依附模型:實體的成長率相當於實體的占比(加入特定實體的機率,為該實體目前人數除以總人數),也就是馬太效應,個人的行動會提高其他人做相同行動的機率。可以用以解釋網路的連結數目、城市大小、書籍銷售量和學術論文引用次數,都呈現冪律分布。

自我組織臨界模型:如沙堆模型、森林大火模型。


長尾分布意謂著當消費者知道其他人的消費選擇,且能不限制地購買相同產品,只要市場中有相互連結、正回饋和一點點運氣,就能獲得驚人的成功。運用於災難或金融崩潰,我們可以預期會有多大規模的災難發生,或避免臨界狀態的發生。最後則是冪律分布的指數代表系統層級的波動性,不同於常態分布,長尾會產生較大的變異量和總和波動。

運用實例:假設一份穩定的工作薪水為常態分布,新創企業家的薪水為冪律分布,當一個年輕人的家庭資源和支持越強,能讓他嘗試和轉換工作的機會越多,他越願意嘗試風險,獲得巨大成功的機率就越大。

 

線性模型:迴歸分析

線性模型中,自變數x的變化會造成應變數y的線性變化,兩者成固定比例。y = mx + b。

係數能提供的資訊包含正負相關、顯著性和量值大小。p值代表係數顯著性,也就是係數不為0的機率。如果p值等於5%,代表有5%的機率數據是在係數為0的情況下產生(即自變數與應變數無關)。

回歸方程式中每個資料點的誤差項error term可能來自省略變數、雜訊或測量誤差。

迴歸只會揭露變數之間的相關性,而非因果關係。就算先建構模型,然後使用迴歸來測試模型結果是否與資料相符,依然無法證明因果關係。資料探勘data mining可能存在把「和其他因果變數相關的自變數」當作「應變數的成因」的風險。資料探勘也可能產生偽相關,在5%顯著性閾值下,如果檢定的變數夠多,等於每二十個隨機變數就會有一個檢定結果呈現顯著(但可能僅僅因為巧合)。若要證實因果關係,要進行實驗,操作自變數並觀察應變數是否改變。但就算迴歸無法證明資料的因果關係,卻還是可以剔除不合理的解釋。

多變數線性模型使用多變數擬合方程式,但愈多變數代表要找到顯著係數需要更多資料。

線性迴歸模型的好處是易於估算和解釋,是一項初步分析資料數據的強力工具。但採取行動時選擇「大係數」變數的思維也表示較為保守,只聚焦在某些緩和的改善方式,無法關注新穎的政策,忽略涉及更根本性改變現有現實的策略。此外我們也不應該推論超出現有資料範圍太多的結論,或是做出時間過長的線性預測。

 

非線性模型:凸函數與凹函數

凸函數:曲線往上彎。成長和正回饋。

  • 凸函數的斜率會不斷增加,任兩點連線都在函數圖形的上方。
  • 指數成長模型:Vt = V0 (1 + R)t,成長率為R。可推論出72法則(當R小於15%,翻倍期數等於72除以R)。
  • 半衰期模型:負斜率的凸函數曲線會愈來愈平緩,可以用來解釋分解、貶值或遺忘資訊的速率。


凹函數:曲線往下彎。報酬遞減(擁有的東西越多,每增加一單位帶來的價值越少)和負回饋。

  • 凹函數的斜率會不斷減少。
  • 偏好多樣性:如果幸福是隨休閒和金錢增加的凹函數,我們會偏好兩者兼具,而非擁有單一一項。
  • 風險趨避:偏好確定結果而非賭樂透。因為斜率遞減時,平均幸福度帶來的價值超過高低幸福度帶來價值的平均值。而凸函數意味風險尋求,即偏好極端勝於平均。
raw-image


經濟成長模型:Cobb-Douglas model是經濟學中最常用的一個模型。

  • 產出同時為勞動力和資本的凹函數,且產出在勞動力和資本加倍的情況下應該也倍增(規模呈線性成長)。
  • 產出 = 常數 x LaK(1-a)

 

簡化的成長模型:

  • 投資 = 儲蓄率S x 產出;產出 = 消費 + 投資
  • 下一年的機器數 = 本年機器數 + 投資 - 折舊率d x 本年機器數。
  • 剛開始產出是遞增的,呈現凸函數,因為機器數量少時折舊的影響遠遠小於投資。因為產出為機器總數量的凹函數,隨著經濟成長,投資也會是機器總數量的凹函數。但折舊是機器總數量的線性函數,最後線性折舊會追上產出的凹函數,當新投資等於折舊損失的機器數量,就達到經濟長期均衡,停止成長。

 

簡化的Solow growth model:

  • 產出 = A√L√K,A為技術水準(創新可增加技術),L為勞動力,K為實體資本。
  • 長期均衡產出 = A(t)2L x (S/d)
  • 模型可看出,產出會隨著勞動力和儲蓄率而線性增加
  • 創新會直接增加產出且導致更多資本投資,讓產出超越線性增加。但需要時間讓新實體資本代替舊實體資本,要更長的時間才會發酵。


貢獻度與影響力模型

合作賽局包含N位玩家和一個價值函數,包含所有玩家的聯盟價值,等於賽局的總價值。

最後上車值LOTB:該玩家為最後一名加入團隊的成員時,為團隊帶來的額外價值(邊際價值)。如果價值函數呈現規模報酬遞減,則LOTB值的加總會小於總價值。LOTB值可以用來測量當成員要脅離開時的價值,聯盟則通常希望降低LOTB值來避免成員離開造成劇烈影響。

夏普利值:找出所有人都加入聯盟的可能順序,並計算該名玩家加入時所帶來額外價值的平均值。所有成員的夏普利值總和為賽局總價值。


夏普利值的公理基礎:

  • 零性質:若該成員在任何聯盟中的額外價值為0,則玩家價值為0。
  • 公平或對稱:相同貢獻度的玩家夏普利值必定相同。
  • 完全分配:所有成員的夏普利值總和為賽局總價值。
  • 可加性:將擁有相同玩家的兩個賽局之價值函數相加形成的賽局,玩家在新賽局的夏普利值應該等於兩個賽局中的夏普利值加總。
  • 運用實例:在多種用途測驗時,我們可以用夏普利值來計算每位成員想法的獨特性。

 

權力指數Shapley-Shubik index of power:

  • 將夏普利值應用到投票賽局,會發現政黨掌握的席次和擁有的權力之間不成正比。
  • 假設國會有101席,A黨40席、B黨39席、C黨和D黨11席。政黨B最先和最後加入不會帶來價值,第二個加入只有在A先加入時有價值,第三個加入只有在A最後一個加入才有價值,因此政黨B的權力指數為1/12+1/12。而CD政黨的情況和B相同,權力指數同樣為1/6。


網路模型

網路包含節點和連結的邊線,邊線可以具有方向性。節點分支度等於節點所連結的邊線數量。

路徑長是兩個節點間最少須經過的邊線數量。路徑長和分支度成反比,和資訊損失正相關。

中介度是就某個指定節點而言,「會通過該節點的最短路徑」數目占所有最短路徑數目的比值。有越高中介度的人知道越多資訊,因此擁有越多權力

集群係數是一個節點的任兩個鄰居之間也有邊線連結的百分比。

raw-image


網路特徵可以用一組網路統計數字來表示。可以藉由和擁有相同數量節點邊線的隨機網路的統計數字比較,來測試網路是否為隨機形成,也稱為蒙地卡羅法

常見的網路包含隨機網路、地理網路(每個節點都會連結到各方向最近節點,分支度低而平均路徑長)、冪律網路、小世界網路(結合地理網路和隨機網路的特色)。

raw-image


網路成形模型提供了解釋網路結構的邏輯。大部分網路結構的突現emerge取決於個別角色是否選擇建立連結。

友誼悖論是指每個人的朋友平均會比自己更受歡迎(平均來說,節點的分支度會比鄰居的分支度還低),這是因為高分支度的人會連結到更多的人。友誼悖論在任何網路都成立。

六度分隔現象:假設每個節點有100位圈內朋友(彼此間互為朋友)C,以及20位隨機朋友R(和節點沒有共同朋友)。一度分隔為C+R = 120,二度分隔為CR+RC+RR = 2000+2000+400 = 4400,三度分隔為CRC+CRR+RCR+RRC+RRR = 328000。隨機朋友可以視為弱連結,弱連結在網路中扮演重要的資訊交流角色。三度分隔朋友雖然和你差異巨大,但又足以建立基本信任,能夠提供你新的資訊和機會。

網路穩定性是指網路節點或邊線消失時是否會造成網路崩潰。我們可以利用「網路節點移除數量」做為函數,考量網路中連結最多的最大連通分支,計算出網路保持連結的機率。在隨機網路中,當節點消失機率達到某個關鍵值時,最大連通分支的規模會急遽下降。而小世界網路則不會發生如此突發的變化,擁有區域集群的網路比較可以避免崩潰。例如電力網的規劃,建立高密度集群會降低效率,也會試圖減少長距離連結,但這麼一來就降低網路的穩定度,區域損壞可能會造成連鎖反應遭成供電網崩潰。

我們也可以從關鍵性的樞紐節點去思考,中介度高的節點,通常貢獻最大,能夠填補社群中的結構洞,但也需要有連結各社群的能力。

 

三種傳播模型:廣播、擴散、傳染

本章使用模型來建立資訊、科技、行為、信念和疾病在人群中傳播的模式,不同的傳播模式將決定採用曲線的型狀。

廣播模型broadcast model

  • 廣播模型可應用在人們從單一來源(電視、網路、水源)接收資訊或疾病的情境,不適用於人傳人的情況。
  • 已知情人數It+1 = It + Pbroad x St,Pbroad為廣播機率,St為易知情人數。
  • 會得到r型採用曲線,每個周期增加的人數越來越少。
  • 容易由資料(如每周期的銷售資料)來推估相關人群大小。

 

擴散模型diffusion model

  • 擴散模型假設一個人接收了某樣東西,會有一定機率傳播給接觸過的人。
  • 擴散模型假設隨機混合,但我們應該要視情況對此假設產生合理懷疑。
  • It+1 = It + Pdiffuse x (It/Npop) x St,其中Pdiffuse是接觸機率乘上分享機率。
  • 採用曲線是S型,隨著已知情人數增加,已知情者和易知情者接觸的次數也增加,因此已知情人數會大幅增加。
  • 要由資料估算相關人群大小十分困難,因為有可能是少量相關人群配上高擴散機率,或是相反。
  • 使用擴散模型時,增加分享機率可以加快擴散速度,但不會影響總銷售量。總銷售量的上限等於相關人群大小,而與分享機率無關。


巴斯模型:

  • 將兩個過程結合到單一模型中。
  • It+1 = Pbroad x St + Pdiffuse x (It/Npop) x St

 

SIR模型:

  • 考慮放棄採用或已復原的人群而建構susceptible/infected/recovered模型,此模型源於流行病學。
  • It+1 = It + Pcontact x Pspread x (It / Npop) x St - Precocver x It
  • 基本傳染數R0等於接觸機率Pcontact乘以傳播機率Pspread除以復原機率Precocver,如果大於1就可以透過人群傳播,小於1則會逐漸消失。
  • 疫苗接種閾值 V 大於等於 (R0-1) / R0
  • 推導基本傳染數R0時假設了隨機混合,我們可以把SIR模型嵌入網路,要注意高分支度節點的超級傳播者不僅較容易傳播疾病,也更有可能被感染,所以它的傳染效果為分支度的平方,此時R0就沒辦法告訴我們太多訊息。

在涉及個人選擇或信仰的時候,我們應該修正模型,允許「在接觸次數增加後,每次接觸時的採用機率將會提高」的可能性。


熵值

使用熵值entropy能說明不確定性、資訊量和意外三者實為同一件事。高熵值表示結果十分不確定,當結果發生時會揭露資訊,同時讓我們感到意外

熵值可以用來測量「與事件結果的機率分布有關的不確定性」,熵越高結果越難預測,機率分布越平均。

資訊熵值

  • 資訊熵值可以想成想了解一個問題(例如投擲硬幣N次)所需要的詢問的是非題數目,預期需要詢問的問題愈多,分布的不確定性就越高。確定結果時,少見(機率越小)的事件一旦發生了所帶來的訊息量較大。當事件一定會發生時,訊息量為0。
raw-image


熵值的公理基礎:

  • 對稱連續函數:重新排序不改變值。
  • 極值性:在所有結果以相同機率出現時,熵有最大值。我們可以用熵描述分布,最大熵值表示最大亂度,分布越均勻。
  • 零性質:結果確定時為0。
  • 可分解性:假設結果為兩個獨立事件產生,兩個獨立事件各自的資訊量相加等於結果的資訊量。

 

用熵值區分四種狀態:

  • 平衡狀態沒有任何不確定性,熵值為0。完美的隨機過程有最大熵值。
raw-image


三種最大熵值分布:

  • 當我們不確定例如藝術品定價的方法,其中一個方式就是假設分布有最大不確定性,也就是最大熵值分布。
  • 分布在一個特定區間內,即有最大值和最小值時,均勻分布會有最大熵值。如果只知道一個範圍或一系列可能結果,除此之外沒有任何資訊,則應該要認為可能結果為均勻分布。
  • 在特定平均值下,且所有數值為正,最大熵值分布為指數分布。
  • 如果固定平均值和變異數,則最大熵值分布就是常態分布。
  • 如果我們認為在特定情境下,微觀層級過程有最大熵值,或是熵值不斷增加,則應該期望這些分布會出現。


熵值測量方法可以實際使用在許多現實世界的應用中,測量金融市場、運動賽事或運氣遊戲的結果是否為隨機等等,當作一種實證性測量方法。

 

隨機漫步

白努利甕模型:

  • 白努利甕模型假想一個裝有灰球和白球的甕,每次抽球為獨立事件。透過機率的計算,就能評估特定事件連續發生的機率。例如波克夏公司在50年間的42年的投資表現優於市場,超過一半機率(1/2)的平均值(25年)四個標準差(50 x 1/2 x 1/2的平方根為3.5年),也就是僅有百萬分之一的機率,因此可以排除運氣因素。


隨機漫步模型:

  • 簡單隨機漫步:初始值為0而隨機在下一個時間給一個有相同機率為1或-1的隨機變數。任何週期的隨機漫步期望值為0,標準差為經過周期數的平方根。隨機漫步的圖形看似有某種模式,其實為隨機產生。
  • 簡單隨機漫步具有遞迴(經常回到0)和無界(可以超出任何限制)兩種特性,與0之間的距離分布呈現冪律分布。如果以隨機漫步模擬公司銷售量或員工數,則公司壽命將呈現冪律分布,與真實資料接近。
  • 我們可以將簡單隨機漫步修改為常態隨機漫步模型(每個周期數值的改變量是從常態分布中抽出來的一個數)或是偏差隨機漫步模型(讓部分結果出現機率較高)。
  • 運動競賽可以模擬成兩個偏差隨機漫步模型,因此越強的隊伍(得分機率高的隊伍)應該加速比賽節奏來爭取更多進攻機會。分析NBA比賽資料會發現,將球隊的進攻模擬為隨機事件,每支球隊的得分對應到偏差漫步隨機值,結果和模型的預測十分接近。雖然我們看比賽時,可能會認為比賽結果一點也不像偏差隨機。
  • 二維隨機漫步還是滿足遞迴性和無界性,所以螞蟻的覓食可以使用隨機搜尋策略。但三維空間中的隨機漫步不滿足遞迴性。
  • 利用隨機漫步的遞迴性,隨機由一個節點出發沿著邊線隨機漫步,回到出發節點的平均時間與網路規模相關,可以用來估算網路規模。

 

隨機漫步與效率市場:

  • 股價已經被證實為接近常態隨機漫步,並趨向正值來呈現市場收益。如果股市有特定模式,很快也會被研究發現而消失,因此股價減去市場一般存在的長期上升趨勢後,最有可能的走勢為隨機漫步。
  • 看起來像趨勢的現象,也可能只是隨機發生。找到最好的公司並研究該公司的特質,並非模型思維。模型思維需要利用資料驗證並推導出可帶來成功的特質。

 

路徑依賴:環環相扣的世界

任何「人群行為受到其他人行為影響」的領域,都很可能一定程度受到路徑依賴影響。

波利亞過程Polya process:

  • 每個週期隨機抽出一顆球時,都再多丟入一顆相同顏色的球,也就是每個週期的結果取決於先前週期的結果,最終的平衡狀態也取決於路徑,產生平衡路徑依賴equilibrium path dependence。
  • 波利亞過程可以呈現社會和經濟現象的正相關影響,例如一個人想學習什麼運動,可能取決於其他人的選擇。
  • 波利亞過程有兩種特性:任何有相同白球數量結果的序列,發生的機率相同;以及白球和灰球的每種分布方式都有相同機率,也就是任何狀況都可能出現,極端路徑依賴。


平衡過程:

  • 抽出一顆球後,會放入另一顆不同顏色的球。
  • 平衡過程會產生結果路徑依賴outcome path dependence,但不會出現平衡路徑依賴,因為不論各種不同路徑都會達到唯一的最終平衡狀態。

 

路徑依賴或臨界點:

  • 路徑依賴會逐漸影響成果,例如微軟的成長過程靠著IBM個人電腦市場成長和DOS作業系統的開發,每個事件都讓下一個成功的事件更有可能發生。而臨界點會驟然改變結果,例如斐迪南大公遇刺造成第一次世界大戰爆發。
  • 我們可以透過可能結果的機率變化(熵值),測量路徑依賴和臨界點。
  • 每當一個行動的衝擊會牽動到未來的行動時,就會出現某種程度的路徑依賴

 

局部交互作用模型

局部多數模型local majority model:

  • 假設一個多格子棋盤,每格為開或關的其中一種狀態,如果所選格子的鄰居有五個以上和所選格子狀態相反,則所選格子就會改變狀態。
  • 模型對於不同的初始狀態並非十分敏感,但選擇啟動格子的順序會呈現出路徑依賴,平衡狀態有如乳牛身上的斑塊。
  • 可以呈現人群局部協調或從眾行為。當互動影響只在局部發揮作用,平衡狀態可以視為次佳均衡suboptimal,造成了多樣化而非每個人都選擇相同的行動。
  • 協調悖論paradox of coordination:如果人們只進行局部協調,則全域狀態看起來會充滿班塊且各有差異。

 

生命遊戲:

  • 單純探索之用,可以解釋簡單的規則如何產生複雜現象。
  • 顯示整體和個體之間的性質可以完全不同。
  • 每個格子狀態為存活或死亡,有三個存活鄰居的死亡格子會復活,存活格子如果有少於兩個或超過三個存活鄰居,則會死亡。
  • 生命遊戲可以產生平衡、循環、複雜狀態等任何結果。

 

李亞普諾夫函數與平衡

李亞普諾夫函數是與動態系統的穩定度有關的函數,例如可以用來證明局部多數模型一定會收斂。

李亞普諾夫函數可以證明自我組織活動模型存在平衡,例如行人人潮、餐廳或公園人數、遊樂園的遊客。

 

馬可夫模型

在馬可夫模型中,會根據固定機率而產生狀態之間的移動。如果系統「狀態數量有限、轉換機率固定、能由任意狀態轉換到達任意另一狀態、沒有固定循環現象」,則馬可夫模型會達到維一的統計平衡,各狀態間雖然有流動但機率分布保持固定。

雖然是結果路徑依賴,但初始條件和歷程對於馬可夫模型來說並不重要,任何干預都無法改變長期狀態,除非模型的其中一項假設不成立

raw-image


馬可夫模型可用來說明產品的流行,取決於耐用度和忠誠度,而非相對銷售量。

Google的網頁排名演算法就使用了馬可夫模型,將每個網站視為馬可夫模型中的一種狀態,另外加入很小的隨機機率讓任何網站可以任意移動,滿足了馬可夫模型的所有假設。

馬可夫模型給我們的啟示是,要深入了解可以改變結構的潛在力量,有些介入措施僅只能改變目前的狀態,而不影響長期的結果。我們可以寫出轉移矩陣來評估介入措施,例如用藥方案、手術,對轉換機率及結果的影響。

馬可夫模型協助我們分辨只有短期影響的「改變狀態的政策」和有長期影響的「改變轉換機率的政策」。如果轉換機率無法改變,就必須定期重置狀態,來改變結果,例如我們的心理狀態切換。

 

系統動力模型

系統動力模型分析的是具有回饋和交互作用的系統,可用來模擬生態、經濟、供應鏈和生產過程。系統動力模型可以辨識出複雜系統的形成原因。

系統動力模型的元素包含來源、目的地、庫存、流量、流速、以及固定流量。

 

麵包店系統動力模型:

  • 下圖的r1表示負回饋,生產速率會隨著麵包庫存的增加而減少。隊伍越長,顧客購買麵包的速率r2就越快。潛在顧客會增加顧客到隊伍中,而隊伍長度會影響潛在顧客加入隊伍的意願。
raw-image


掠食者-獵物模型Lotka-Volterra equation:

  • 野兔H以固定比率g成長,狐狸以固定比率d死亡。兩者接觸的機率和兩者數量相乘成正比。野兔和狐狸接觸時以被捕食比率a乘以兩者數量乘積的速率死亡,而狐狸以狐狸補食野兔造成的增加率b乘以兩者數量乘積的速率成長。這些假設可以寫成下列微分方程式:H = gH -aFH, F = bFH - dF。
  • 方程式可以達到滅絕平衡F=H=0或內部平衡。
  • 內部平衡時H = d/b, F = g/a。這個模型產生一個不直觀的結果,狐狸在平衡狀態下的數量和狐狸死亡比率毫無關係,因為狐狸死亡增加代表野兔增加,進而讓狐狸群體成長率增加,兩者正好抵銷。野兔在平衡狀態下的數量也與野兔成長比率或被捕食比率無關
  • 模型幫助我們進行完整的邏輯推理思考,而不是只運用注重直接效應的直覺

 

個體為本模型

抗爭模型Granovetter riot model:

  • 個人會根據總變數值是否超過閾值,來改變行動的選擇。一開始閾值為0的民眾會加入抗爭,之後閾值小於總抗爭人數的會在下一個時間加入抗爭。
  • 模型顯示閾值平均值並不重要,全體的閾值分布才是社會運動是否發生的關鍵。
  • 網路新創公司必須創造買賣雙方的「同步雙重抗爭」,例如Airbnb解決屋主發布資訊的困境,藉此吸引租房者,讓雙重抗爭發生。
  • 抗爭模型也可以解釋股市的閃崩,當擁有資產者的資產下跌到崩潰閾值,投資人會賣掉資產,導致正回饋讓更多人賣出資產。

 

謝林派對模型Schelling's party model:

  • 每個客人屬於類型A或B,先隨機選擇一個房間,每個週期每位客人都有機率p移動(隨機漫步)到另一個房間。如果房間中與客人i同類型的人小於容忍閾值,則i會離開房間。總客人的數量和各客人容忍閾值的差異都會影響分隔的結果。
  • 謝林分隔模型則是放置在棋盤格中,閾值多樣化一樣會加劇分隔效應。

 

乒乓模型:

  • 如果系統狀態的絕對值超過實體的反應閾值,實體會改採「可降低系統狀態值的絕對值」的行動。
  • 類似鐘擺效應,乒乓模型加入了負回饋,會在平衡狀態附近產生循環行為。
  • 閾值多樣化越大,越能帶來穩定與緩和的變化。由此可知閾值多樣化會加劇正回饋並減緩負回饋。

 

空間與特徵選擇模型

以屬性呈現選項的個人選擇模型。

空間spatial屬性沒有最佳選擇,每個人都偏好特定屬性大小,例如菜色的辣度。屬性與消費者心中的理想位置越接近,對消費者來說價值就越高。特徵hedonic或享樂屬性則是越多(少)越好。例如手機電池壽命、鞋底耐用度,特徵競爭模型中,每個人對各項屬性的偏好差異不大。

在建構模型時,我們應當區分人們渴求結果的基本偏好,和人們為了達成基本偏好結果而產生的工具偏好。

 

空間競爭模型:

raw-image


  • 抽象概念的屬性需要轉換為數字。
  • 更廣義的空間競爭模型可包含任意數量的屬性,產品價值函數可以寫成「常數項」減掉「選項與消費者理想位置的差距」。
raw-image
  • 要注意的是,意識形態具有不確定性,可能需要用一個區間代替一個點。如果只用一維模型,候選人將有強烈誘因採取中間立場,但高維模型就很難找到平衡狀態。

 

特徵競爭模型Lancaster model

  • 模型允許個人在不同維度加上不同權重,呈現出異質性(例如品質越高越好、價格卻越低越好)。配合線性迴歸,就可以使用特徵競爭模型來推理出商品屬性的隱含價值。

 

三種賽局模型

賽局理論在模擬策略性互動。

如果玩家各自選擇的策略,就對方所選的策略來說,都是自己所能選擇的最佳因應策略,此時兩位玩家的策略組合即稱為奈許均衡(沒有人有動機單方面改變策略)。

時間、金錢和可分配的資源都十分有限,所以許多個人行為和個人選擇為零和賽局,但是一個維度的零和賽局,並不代表在其他維度也為零和。

 

正規形式normal-form的零和賽局

  • 根據玩家自身行動與另一位玩家的行動,來獲得相應的報酬。零合表示兩玩家的報酬加總為0。
  • 錢幣配對,每位玩家選擇正面或反面,而上方玩家想要出按左側玩家不同的硬幣面。此時只有唯一的均衡策略就是各自隨機選擇,因為任何非隨雞舍略都會遭對手利用。例如足球PK罰球時,前鋒會想要隨機瞄準左側或右側。
raw-image
  • 最小化風險賽局,這是非對稱零和賽局,左側玩家的優勢策略dominant strategy(無論對手採取何種策略都一定會採用的策略)為選擇安全行動,而上方玩家沒有優勢策略。當上方玩家推理出左方玩家為選擇安全,所以也選擇安全,則達到唯一奈許均衡。
raw-image


逐步賽局sequential game

  • 玩家依照特定順序行動,順序會呈現在賽局樹上。策略對應到每個節點的動作選擇。可以使用逆向歸納法,從末端節點出發解出子賽局均衡,找出每位玩家的最佳行動。
raw-image


連續動作賽局continuous-action game

  • 玩家可以選擇努力程度的連續動作賽局,例如跳棋。付出越多努力,則有越高機率贏得獎賞。
  • N位玩家贏得價值M的獎賞,玩家贏得獎賞的機率等於「玩家付出的努力」除以「全部玩家付出的努力之和」。奈許均衡下的努力水準為M/N - M/N2。個人努力隨著獎賞越大而增加,但隨著玩家數量增多而下降。

 

合作模型

促進合作的機制:重複repetition、信譽reputation、局部集群local clustering、群體選擇group selection,這四種機制都能在沒有外部干預和管理下促成合作。

 

囚犯困境

  • 囚犯困境的通用型式;背叛的誘惑T>合作的獎勵R>皆背叛的基準報酬0>遭到背叛的傻瓜報酬-S。2R大於T-S。雖然背叛為玩家的優勢策略,但雙方合作才能產生效率效果。
  • 賽局重複能夠「維持」理性決策者之間的合作,但不保證玩家一定會合作。可以用公式算出,獎勵報酬增加、賽局重複機率增加或誘惑報酬降低,會讓合作更容易維持。如果玩家認為未來賽局進行的機率低於閾值,則理性玩家會在機率改變前就停止合作。因此重複賽局需要有一定的機率繼續進行,而非重複固定次數,才有助於維持合作。
  • 建立信譽機制來維持合作,則網路必須擁有高集群係數,集群係數代表社會資本social capital,或者有方法辨識過去的賽局對手,以及所有人同時也必須相信其他人一定會背叛背叛者。可以應用SIR模型嵌入網路來評估背叛行為傳播的可能性。

 

規則為本的行為

  • 同一群玩家在重複賽局中,假設玩家應用規則為本的策略,此設定之下各項策略的表現取決於玩家策略的分布狀況。
  • 突變或演化出合作行為的必要條件是:合作的報酬大於背叛的報酬。並取決於起始採用各種策略的玩家分布,以及人們如何學習並演化出新策略。

 

合作行動模型

  • 合作者和背叛者在網路中互相連結,合作者會花費成本C並產生利益B給另一位玩家。合作優勢比率B/C,呈現出合作帶來的潛在利益。
  • 網路(局部群集)是讓合作發生,甚至自我引導的重要關鍵。如果是由注重信譽、思考縝密的決策者來維持合作,連接越多越有助於合作。如果為簡單決策者自我引導或演化而出,例如螞蟻的合作,則連結越少的網路越能產生合作。

 

群體選擇

  • 群體選擇依賴族群間的競爭或選擇(優勝劣敗)。
  • 個體和族群存在緊張關係,個體選擇對背叛者有利,但群體選擇卻對合作者有利。
  • 合作行動模型同時包含了個體和群體選擇,顯示只要合作行動的利益相對夠大,並且最大族群規模相對於族群數量夠小,則群體選擇都能夠增加合作行動。較小的最大族群規模,可以限制個體選擇效應。

 

三個集體行動問題

集體行動問題collective action problem,是個人利益與集體利益衝突的狀況。每個人必須在「為團體做出貢獻」(最大總合報酬)和「搭便車」(個人最大報酬)之間作選擇。

 

公共財提供問題:

  • 公共財滿足非競爭性(個人使用不影響其他人使用)和非排他性,包含乾淨空氣、國防、國內治安、知識生產等。
  • 因為成員低估自身貢獻的價值,才會造成公共財提供問題。
  • N位成員各自分配收入到各單位成本為1美元的公共財和私有財,每位成員的效用函數為2√公共財 + 私有財。模型中公共財效用為凹函數,私有財效用為線性函數。
  • 最大化成員效用總和的社會最適分配為公共財= N。均衡分配為公共財=1/N。隨著團員成員變多,公共財的最適分配水準提高,但為公共財做出貢獻的誘因卻降低了。
  • 可以加入利他參數a呈現出關心他人的狀況,當a=1表示會貢獻出社會最適水準。只要成員人數夠多,成員貢獻值約為最適水準乘以利他參數的平方。

 

壅塞問題:

  • 如道路、海灘和供水系統等資源。個人使用資源獲得的利益會隨著使用人數而線性減少,線性減少的斜率為壅塞參數。
  • 壅塞問題的資源過度使用並不會造成長期效應。
  • N個人當中,有M個人選擇使用資源,則效用函數(M) = B(最大利益) - T(壅塞參數) x M。剩下N-M個人獲得效用為0。社會最適分配M=B/2T,效用函數(M)=B/2。奈許均衡時壅塞太嚴重而沒有人得到利益,效用函數(M)=0,所以M=B/T為最適分配的兩倍。
  • 我們也可以寫出多種壅塞公共財的函數,去分析壅塞的解決辦法,例如蓋更多設施、分配使用時間、收費、配給制、抽籤等等。

 

可再生資源開採:

  • 未來可用的資源量取決於現在使用的資源量,會因為過去的失敗付出永遠的代價。
  • 可再生資源量R(t+1) = (1 + g資源再生速度) (Rt-Ct),C為t週期時消耗的總資源量。均衡消費水準 = R x g / (1 + g )。
  • 當消費速度超出均衡消費水準,會造成崩潰,要避免崩潰必須能夠調整開採水準。

 

機制設計

制度包含人們溝通資訊的方式,以及根據揭露的資訊做出決定、分配資源或進行產出的程序。設計良好的機制能促進產生理想結果的溝通和行動。

模擬制度的架構稱為機制設計mechanism design,這些架構強調真實制度的四大面向:資訊、誘因(採取特定行動的利益和成本)、聚合(個人行動如何轉換為集體結果)、計算成本(對參與者的認知要求)。

現今的假設方式為假設人們會表現出最佳行為,讓架構適用於賽局理論的推理。然後機制設計者會根據理性行為,解出奈許均衡,並比較制度的優劣。

 

芒特雷特圖

  • 機制包含六個部分:環境、一組結果、一組行動(或傳遞訊息)、行為規則、映射行動到結果的結果函數、映射環境到一組所希望結果的社會選擇對應。機制若能實現社會選擇對應,即為理想結果。
  • 社會選擇對應social choice correspondence一般包含使參與者效用總和最大化的結果,或一組柏拉圖效率Pareto efficiency。
  • 柏拉圖效率為不可能在不使任何其他人受損的情況下再改善某些人的狀況,意即不存在任何所有人都有更高偏好的結果。如果沒有存在一種所有人都更偏好的結果,現在的結果即為柏拉圖效率結果。柏拉圖效率為理想標準中的最低標準
  • 根據不同情境,我們希望機制能達成的性質也不同,可能是達成與社會選擇對應相符合的結果、或讓參與者採用優勢策略、或讓大家自願參與、或希望預算平衡(不額外支付金錢或摧毀資源)、或讓人們互相傳遞真實資訊。沒有一種機制能滿足所有想達成的條件。
  • 我們不應該浪費時間設計不可能達成的機制,而應努力思考如何在效率、說實話和預算平衡之間取得妥協。
raw-image


多數決原則和擁立國王原則

  • 假設三個人想要看電影,A喜歡動作片>喜劇片>劇情片,B喜歡喜劇片>劇情片>動作片,C喜歡喜劇片>劇情片>動作片。則喜劇片和動作片都達到柏拉圖效率。此種狀況下多數決原則不一定能達成柏拉圖效率結果,而擁立國王機制(隨機選一個人擁立國王,國王決定選擇)中,如果擁立國王者採取理性行動,結果並訂為柏拉圖效率。

 

拍賣機制

  • 拍賣機制的柏拉圖效率結果為標的物賣給估價最高的競標者。
  • 增價拍賣ascending-bid auction,拍賣人不斷提高價格直到剩下一位競標者。最後一位競標者需要支付倒數第二個競標者放下手時,拍賣人喊出的價格。若所有競標者皆採取理性行動,則估價最高的競標者會得標,並支付估價第二高競標者的估價。
  • 次價拍賣second-price auction,每個競標者提供一個密封出價其他人不會看到,由出價最高的競標者得標,支付出家次高者的價格。此時競標者提交自己對於標的物的真實估價為最佳策略。此機制為誘因相容incentive compatibility,人們傳遞的訊息能揭露真實資訊或個人真實狀況。
  • 首價拍賣first-price auction,每位競標者同時出價,出價最高者贏得拍賣並支付出價價格。此時出價策略取決於其他競標者對自身以外競標者出價的信念。假設估價為均勻分布且所有競標者採用最佳出價,如果有N個競標者,則所有人應該出價自己估價的(N-1)/N。首價拍賣也能產生效率效果,且可以計算出得標者ˇ支付的價格等於第二高競標者的估價。

 

收益等價定理

  • 在任何「競標者都是從已知共同分布中,得出獨立的個人估價」的拍賣機制中,只要符合「競標者採取最佳行動、最高出價者贏得標的物、以及對標的物估價為0的競標者期望報酬為0」,則皆會產生相同的期望收益和報酬。
  • 這也表示實際拍賣中,只要競標者沒有使用最佳策略,或是對其他競標者的估價分布有不同信念,就會產生不同的收益。
  • 拍賣類型不同,也會吸引不同數量的競標者,例如相對於增價拍賣,小公司會更想要參加首價拍賣。
  • 增價拍賣和次價拍賣都有優勢策略(無論其他人採用何種策略都是最佳的策略),首價拍賣則沒有,因為對手的策略會改變競標者的最佳策略。
  • 拍賣方式也可能引導競標者做出非最佳行為,例如增加拍賣可能會激起情緒的反應。

 

公共工程決定機制

  • 假設N個人從成本C的公共工程中獲得不同的貨幣價值,只有在總和價值大於成本時,公共工程才會進行。
  • 若以多數決平均分攤,及多數人贊成就進行工程,而每人支付成本C/N,此機制違反效率和自願參與。
  • 支點機制則是每個人會提交對工程的估價,如果估價加總大於工程成本,則會進行工程。個人需要負擔的成本為工程成本減去其他人的估價加總。支點機制在採用優勢策略下,能滿足誘因相容和效率結果,但不需要滿足預算平衡。

 

訊號傳遞模型

人們在何種條件下傳遞高成本訊號,已揭露資訊或自身的類型,例如炫耀性消費或社群媒體發文。

如果訊號要產生實際作用,則必須有較高的傳遞成本且有足夠的證明力

人類學家以區分出三種代價高昂的訊號形式:無條件慷慨、浪費的維生行為(例如狩獵)和工藝傳統。

為了減少傳遞訊息花費的成本,可以試著讓訊號產生實用價值。

 

離散訊號傳遞模型:

  • 個人只能選擇傳遞或不傳遞,每個人的傳遞訊號成本不同。
  • 人數N的群體中,包含S位強類型和W位弱類型的成員,傳遞訊號成本為c和C且c<C。根據訊號傳遞者得到的利益B和傳遞訊號的成本,可能有三種結果:混和pooling(C<B/N,兩種類型都會傳遞訊號);分離separating(c<B/S且B/(S+1)<C,僅強類型會傳遞訊息);部分混和(c<B/N<C<B/(S+1),某部分的弱類型會傳遞訊息)。

 

連續訊號傳遞模型:

  • 可以改變訊號的強度。
  • 人數N的群體中,包含S位強類型和W位弱類型的成員,傳遞訊號成本為c和C且c<C。傳遞最大訊息的人平分利益B,則任何訊號大小M>=B/SC可以分離強類型(當強類型的人越多,必須傳遞的訊號量就越少,因為弱類型越南藉由傳遞訊息來獲利)。如果CW>=cN,則可以分離出所有強類型。

 

學習模型

強化學習模型reinforcement learning model

  • 模型會強化較高報酬的行動,行動分配到的權重,取決於個人過去採取該行動獲得的報酬。
  • 如果獎勵越讓受試者感到訝異(遠超過過去或預期的報酬),則會學習得更快。
  • 特定選項的權重,會和學習速度、報酬的絕對大小、報酬超越激勵水準的程度成正比。
  • 如果激勵水準一直等於平均報酬,最終權重會收斂到最高報酬的選項。
  • 可以修正將「未選的選項」根據假設的報酬獲得權重,來符合人們增加「未做過但能帶來高報酬的行動」的機率(基於信念的學習)。

 

社會學習模型

  • 每個人會從自身的和他人的選擇中學習,往往會模仿最多人採用或高於平均表現的行動,這種現象會加速學習速度。
  • 模仿者動態replicator dynamic假設個人採取一項行動的機率,等於行動報酬和流行程度的乘積。假設群體人數無限,會收斂到整個群體都選擇最佳選項。

 

賽局中的學習

  • 將學習模型套用到賽局中,會收斂到風險優勢平衡(個人報酬較高),而非總報酬高的效率平衡。

 

善惡賽局

  • 比較絕對利益和相對利益衝突的狀況,分別為增加每位玩家絕對報酬的慷慨行為,和只增加自己報酬的惡毒行為。慷慨行為是善惡賽局的優勢策略。
  • 如果把強化學習模型應用到善惡賽局中,玩家會學會選擇慷慨行為。但如果是模仿者動態模型,群體將學習到採取惡毒行為能獲得較高報酬。
  • 關鍵差異在於個人學習引導人們選擇較佳行動(優勢行動),社會學習引導人們選擇「相對於」其他行動表現較佳的行動。因位在社會學習中,人們會模仿其他表現較佳的玩家的行動。

 

多臂拉霸機問題

多臂拉霸機問題中,選擇選項得到的報酬以分布(而非固定值)來呈現。人們必須對各個選項進行嘗試來了解不確定報酬的分布,在探索exploration和利用exploitation之間取捨

在高風險的商業活動、政策和醫療等等容易蒐集資料的領域,往往都會應用多臂拉霸機來做決策。

 

白努利拉霸機問題

  • 也稱作頻率論問題frequentist problem,相當於從多個白努利甕中做出選擇,必須在探索過程中得知多臂拉霸機的報酬分布。
  • 我們可以使用自適應探索率啟發法adaptive exploration rate heuristic,按照成功比率來安排往後的測試。

 

貝氏多臂拉霸機

  • 決策者對於個選項的報酬分布擁有先驗信念(瞭解各選項報酬的事先分布)。每個周期中,決策者會選擇吉丁斯指數最大的選項得到報酬,再根據報酬計算下一周期個選項的吉丁斯指數。
  • 吉丁斯指數不等於期望報酬,而是「假設我們根據目前所知而採取最佳行動時,所有未來報酬的加總」。
  • 比起期望報酬,我們更關心選項為最佳選項的機率探索潛在的高報酬行動。

 

崎嶇地形模型

繁殖潛力地型模型fitness landscape:

  • 地形圖中只有一個山峰,很容易找出最佳解。例如土狼尾巴的長度和繁殖潛力的對應,演化很快就會找到答案。

 

多座山峰的地形:

  • 使用不同方法找尋最高點,可能會定位到不同山峰,不同出發點也會找到不同山峰。崎嶇會造成初始條件對結果影響重大及路徑依賴的可能性。
  • 要在崎嶇地形上找到全域山峰而非局部山峰,需要使用多樣化的方法。
raw-image


多模型運用的實例:所得不均問題

對數常態分布:財富收入的分布,長尾部分逐漸拉長。

柯布-道格拉斯模型:科技進步增加了對受過教育工人的有利指數,加上低教育水準移民的移入增加低技術工人的供給。

偏好依附模型:網路連結的正回饋解釋了職業內部的差異擴大。

空間競爭模型:解釋不受社會力量影響的執行長薪資,因為薪酬委員會的成員往往是其他執行長。

72法則:資本報酬率超過了整體經濟成長率。

選型交配:受教育的女性增加,以及人們傾向和同樣教育水準的人結婚,增加了家庭層級的所得不均。

馬可夫模型:因社會技能、內隱知識、面對風險和教育的態度,以及遺產,降低不同收入水準的社會階層之間的流動。

持續不均模型:謝林分隔模型和局部多數模型指出,孩子未來收入取決於先天能力、教育花費和外溢效應。再加上網路模型得知高收入社區的教育和外溢效應和社區的收入水準相關。

結論:模型能解釋的收入差異大小和部分,各不相同。藉由模型我們得以找出產生和維持所得不均的多個流程,並觀察流程之間的互動。

raw-image


留言
avatar-img
留言分享你的想法!
avatar-img
蔡孝祺的沙龍
30會員
151內容數
看完如何閱讀一本書之後,決定開始將每本書整理起來,成立這個部落格強迫自己練習維持寫作的習慣
蔡孝祺的沙龍的其他內容
2025/05/23
知行合一 王陽明(1472-1529)(暢銷經典版) 度陰山  2023 大旗出版社 分類:傳記  ★★★★★ 詳述王陽明的生平,創造心學的心境轉折,以及略述心學的內容。
Thumbnail
2025/05/23
知行合一 王陽明(1472-1529)(暢銷經典版) 度陰山  2023 大旗出版社 分類:傳記  ★★★★★ 詳述王陽明的生平,創造心學的心境轉折,以及略述心學的內容。
Thumbnail
2025/05/17
極客之道:科技天才的商業制勝邏輯 The Geek Way: The Radical Mindset That Drives Extraordinary Results
Thumbnail
2025/05/17
極客之道:科技天才的商業制勝邏輯 The Geek Way: The Radical Mindset That Drives Extraordinary Results
Thumbnail
2025/05/12
悲劇哲學家尼采(經典全新修訂版) 陳鼓應  2022 臺灣商務圖書館 分類:論說--理論  簡介尼采的生平、重要思想以及重要作品節錄。 重要字句: 尼采的第一部主要著作《悲劇的誕生》,藉著解釋希臘藝術精神時,賦予酒神以意志的驅動力,並賦予太陽神以思維的清
Thumbnail
2025/05/12
悲劇哲學家尼采(經典全新修訂版) 陳鼓應  2022 臺灣商務圖書館 分類:論說--理論  簡介尼采的生平、重要思想以及重要作品節錄。 重要字句: 尼采的第一部主要著作《悲劇的誕生》,藉著解釋希臘藝術精神時,賦予酒神以意志的驅動力,並賦予太陽神以思維的清
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
創業不能不講究策略,而不懂得放棄,就是不懂得策略的精義。(挑選出自己最擅長的部分進行開發) 停留在評論家這個角色是行不通的,就算下雨機率是50%,能夠說出,出門請記得帶把傘的人,才是真正的參謀。 不要依賴公司名號生存,要用自己的名號在這個世界上暢行無阻。 不要總是在別人都還沒明確看出失敗之
Thumbnail
創業不能不講究策略,而不懂得放棄,就是不懂得策略的精義。(挑選出自己最擅長的部分進行開發) 停留在評論家這個角色是行不通的,就算下雨機率是50%,能夠說出,出門請記得帶把傘的人,才是真正的參謀。 不要依賴公司名號生存,要用自己的名號在這個世界上暢行無阻。 不要總是在別人都還沒明確看出失敗之
Thumbnail
你今天必須做別人不願意做的事,明天才能夠擁有別人不能擁有的東西。
Thumbnail
你今天必須做別人不願意做的事,明天才能夠擁有別人不能擁有的東西。
Thumbnail
今天要介紹的《人生算法》也是中國的商業思維書籍,主要是講人生算法中三大要素:時間、空間、機率。幾個相互疊加,靠著思維工具,幫我們在生活中更好地做出決策。
Thumbnail
今天要介紹的《人生算法》也是中國的商業思維書籍,主要是講人生算法中三大要素:時間、空間、機率。幾個相互疊加,靠著思維工具,幫我們在生活中更好地做出決策。
Thumbnail
★願意多方嘗試、累積多重專業、能策略思考才是未來最需要的人才!
Thumbnail
★願意多方嘗試、累積多重專業、能策略思考才是未來最需要的人才!
Thumbnail
《解決問題的人》這本書是丹尼·沃謝教授所寫,通過豐富的經營案例和不同背景、不同年齡的創業故事,展示了創業的多種可能性和實踐經驗。這本書強調,解決問題不是什麼神秘天賦,而是一種學得會的技巧,這樣的創業思維,也可以應用到日常生活裡,就能在創業和生活中做得更好,甚至實現夢想。
Thumbnail
《解決問題的人》這本書是丹尼·沃謝教授所寫,通過豐富的經營案例和不同背景、不同年齡的創業故事,展示了創業的多種可能性和實踐經驗。這本書強調,解決問題不是什麼神秘天賦,而是一種學得會的技巧,這樣的創業思維,也可以應用到日常生活裡,就能在創業和生活中做得更好,甚至實現夢想。
Thumbnail
好的策略思考,取決於反直覺的智力運用方式。傑出的策略思考者能容忍模糊性、察覺微弱信號、定義核心挑戰,並設計有效對策。本書透過實例解析致勝策略的邏輯,協助讀者獲得能應用在組織建構及個人發展的精微技巧。
Thumbnail
好的策略思考,取決於反直覺的智力運用方式。傑出的策略思考者能容忍模糊性、察覺微弱信號、定義核心挑戰,並設計有效對策。本書透過實例解析致勝策略的邏輯,協助讀者獲得能應用在組織建構及個人發展的精微技巧。
Thumbnail
《持續買進:資料科學家的投資終極解答,存錢及致富的實證方法》 Just Keep Buying: Proven Ways to Save Money And Build Your Wealth
Thumbnail
《持續買進:資料科學家的投資終極解答,存錢及致富的實證方法》 Just Keep Buying: Proven Ways to Save Money And Build Your Wealth
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
這篇文章是關於一堂線上課程《用經營公司的思維,經營你的人生》的分享和心得。課程主要內容包括引導思考個人的「願景」和「優勢」,以及從經營公司的五個面向來重新整理生活。作者分享了為什麼決定購買這門課程,以及課程中讓他印象最深刻的部分和難以執行的部分。
Thumbnail
這篇文章是關於一堂線上課程《用經營公司的思維,經營你的人生》的分享和心得。課程主要內容包括引導思考個人的「願景」和「優勢」,以及從經營公司的五個面向來重新整理生活。作者分享了為什麼決定購買這門課程,以及課程中讓他印象最深刻的部分和難以執行的部分。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News