我對精準度可解釋性權衡的三個思考：度量相關，模型族專屬，權衡的確存在

紫式講義

2022/08/04 更新2022/08/04 發佈閱讀 9 分鐘

本文章收集與評論三個體現「精準度-可解釋性權衡 (Accuracy-Interpretability Tradeoff)」的例子。

在詐欺偵測的數據集中，本來預期要觀察到的權衡，似乎並沒有出現。這令人非常好奇這個權衡的故事，源頭是哪邊。

本文章收錄三個，對於此權衡的認知升級

這個權衡，似乎是metric dependent的
可解釋性的刻畫，是model class specific
賭博預測，在小範圍的模型下，的確有這個權衡

思考#1：權衡的確發生在R score與平均絕對誤差上

此文章提供了一個「精準度-可解釋性權衡」的實踐例子。

此文章考慮的三個模型為

線性回歸 (Linear Regression)
決策樹 (Decision Tree)
梯度提升法 (Gradient Boosting)

裡面提供的數據為

#1 線性回歸
Mean Squared Error: 19592.4703292543
R score: 0.40700134640548247
Mean Absolute Error: 103.67180228987019
#2 決策樹
Mean Squared Error: 10880.635297455
R score: 0.6706795022162286
Mean Absolute Error: 73.76311613574498
#3 梯度提升法
Mean Squared Error: 1388.8979420780786
R score: 0.9579626971080454
Mean Absolute Error: 23.81293483364058

可以看到的是，隨著模型可解釋性下降，R score與Mean Absolute Error有顯著上升。

🤔 然而，這並不代表「分類任務」也會有這個權衡。還續繼續觀察。

思考#2：廣義加性模型，似乎沒有這個權衡

此文章提供對廣義加性模型(Generalized Additive Model; GAM)的可解釋性思考。

文章提供的觀點是，歸納偏誤(Inductive Bias)是可解釋模型中重要的元素。

Our results suggest that inductive bias plays a crucial role in what interpretable models learn and that tree-based GAMs represent the best balance of sparsity, fidelity and accuracy and thus appear to be the most trustworthy GAM models.

其中想權衡的三個點為

Sparsity: use fewer features to make predictions 用少一點的特徵來做預測
Fidelity: true patterns in the data 要能反應數據的真實模式
Accuracy: 就是準確度

思考#3：解釋賭博，的確在小範圍有這個權衡

此文章是要看賭博行為，需要算法可解釋性。

Section 2 discusses the related work in the application of machine learning to understand and interpret gambling behaviour. Section 5 discusses the interpretability of our empirical results, and concludes the need for further research of understanding and measuring algorithm interpretation.

同樣的邏輯，應該也可以應用到我們這裡。

可解釋性的需求，來自Responsible Gambling這個社群，需要輸出對賭博行為的知識。

As reported in [15], we polled the audience at a related presentation at the 2016 New Horizons in Responsible Gambling conference to explore the importance of knowledge extraction and algorithm interpretability.

用投票的方式，人還是喜歡可以解釋的演算法或模型。

Respondents were asked whether they would prefer a responsible gambling assessment algorithm that provided a 90% accurate assessment of problem gambling risk that they could not unpack or understand, or a model that provided a 75% accurate assessment that was fully interpretable and accountable. Only 20% chose the more accurate model, with 70% preferring to sacrifice 15 percentage points of accuracy for greater interpretability (10% were uncertain or felt it depended on the circumstances).

這邊的目標是預測有害博弈(Harmful Gambling)。也算是一種分類問題。

其使用的數據集，在上癮部門可以拿到。

Building on the work from the live action sports betting dataset available from the Division on Addiction public domain, in [12] nine supervised learning methods were assessed at identifying disordered Internet sports gamblers.

This paper focuses on knowledge extraction by using random forests and artificial neural networks and TREPAN on a new IGT dataset to not only predict, but also describe, self-excluders through knowledge extraction.

裡面比較了Random forest, Neural Network, Decision Tree. 是用預測正確率來看。其中Random forest最好。

感覺這個還是要自己做看看才知道。

而外產生的對合成數據的思考

合成數據與模擬數據還是不一樣的。

合成數據是根據真實數據來訓練一個「數據集模型」，藉此生成數據
模擬數據則是根據數理模型，根據隨機性機率理論，生成數據

合成數據訓練，可解釋性要如何賣？

想要弄成三個維度。現在有Fidelity, Accuracy，但不知道要怎麼「量化」可解釋性。

可能可以做Adult dataset，更原始，可能有更好的觀察？

留言

紫式講義的沙龍

4會員

23內容數

思考合成數據的各種原理，應用與效果。

紫式講義的沙龍的其他內容

2022/08/05

我對防彈筆記的三個思考：文章四元素，書籍內容，精選閱讀

思考#1：防彈筆記的四個元素：目標成果，要解決的問題，下一步行動，下一步連結站長在呈現此書，使用的元數據(Metadata)為目標成果要解決什麼問題下一步行動下一步連結這個格式蠻好的，可以連結書的內容。思考#2：鳥瞰書籍內容 Part 分析防彈筆記的改變防彈筆記的原則內容分析

2022/08/05

我對防彈筆記的三個思考：文章四元素，書籍內容，精選閱讀

2022/08/05

強盜算法的三個職位：資深運籌學科學家，機器學習科學家，資料科學家

這篇文章記錄與強盜算法有關的職位。職位#1：Amazon 資深運籌學科學家職位#2： Tripadbisor 機器學習科學家 II Machine Learning Scientist II 職位#3：BOA 資料科學家 Data Scientist Desired skills:

2022/08/05

強盜算法的三個職位：資深運籌學科學家，機器學習科學家，資料科學家

2022/08/04

我對認知方法論的三個思考：生，老病，死

本文章與你分享我接觸這篇認知方法論課程後，產生的思考理解。對「認知」這個字，搭配上生老病死，我覺得有下面的意涵：生：零認知老：覺得認知迭代病：覺得認知缺乏死：不再需要認知

2022/08/04

我對認知方法論的三個思考：生，老病，死

看更多

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

#創作#創作者推薦#靈感

2026/03/25

Jacky Lu說故事

㊙️國泰金 - 用多元線性回歸計算合理價!

似乎挺合理的~

#國泰金#2882#股票

2024/08/11

Jacky Lu說故事

㊙️國泰金 - 用多元線性回歸計算合理價!

似乎挺合理的~

#國泰金#2882#股票

2024/08/11

教育心理博士的筆記本

CFA和SEM適配指標沒過該怎麼辦?

CFA和SEM分析的擬合指標通常需要達到專家門檻，才可以進行分析。我整理知名統計學者Hair的建議，並附上相關文獻佐證，讓讀者能正確地進行模型修正，讓適配指標過關。

2023/12/18

2023/12/18

由醜媳婦總是要見公婆-績效報表的最佳化報表可知，無論我們將連續創高或創低的K棒數如何改變，均不可能讓淨利變正，代表我們不可能靠單一個指標值來獲利，此時改善方式只能再回到觀察圖表，由圖表中的訊號觀察是否有什麼改善方式。由圖表中可發現當標示的紅點或綠點離均線越遠，則進場的時機點越好，如果可以增加

#程式交易#MultiCharts#策略改善

2023/11/08

股市觀察家的沙龍

三個臭皮匠勝過一個諸葛亮

#程式交易#MultiCharts#策略改善

2023/11/08

MC 統計的沙龍

區間估計

上一篇文章中, 我們向大家介紹了點估計, 提出了許多點估計會有的問題, 也給出了一些其他的替代方案, 今天我們將會從資料分散程度的角度切入, 跟大家分享另外一種做法。

2023/07/16

2023/07/16

在经济学领域，现代的宏观经济全局性系统模型可以分为四大种类。

2023/05/20

小KY的沙龍

为经济把脉

在经济学领域，现代的宏观经济全局性系统模型可以分为四大种类。

2023/05/20

教育心理博士的筆記本

多元迴歸分析簡介

多元線性迴歸分析(Multiple regression analysis)是一種統計學方法，用於探索多個解釋變量對一個目標變量的影響。它是建立在線性迴歸分析的基礎上的，多元迴歸分析用於探討多個預測變數及一個依變數之間的關係，並且每個變項都是連續變項。本文將介紹多元迴歸分析概念。

2023/04/15

2023/04/15

潛在類別／剖面／混合分析操作1:找出最佳組數

潛在類別模式（latent class modeling, LCM）和潛在剖面分析(Latent Profile Analysis, LPA)是探討潛在類別變項的統計技術。兩者與因素分析最大的不同在於潛在變項(因素)的形式。本文將介紹潛在類別／剖面／混合分析操作1:找出最佳組數

#混合分析#找出最佳組數#Mplus

2023/01/31

教育心理博士的筆記本

潛在類別／剖面／混合分析操作1:找出最佳組數

#混合分析#找出最佳組數#Mplus

2023/01/31

紫式講義的沙龍

我對精準度可解釋性權衡的三個思考：度量相關，模型族專屬，權衡的確存在

本文章收集與評論三個體現「精準度-可解釋性權衡 (Accuracy-Interpretability Tradeoff)」的例子。在詐欺偵測的數據集中，本來預期要觀察到的權衡，似乎並沒有出現。這令人非常好奇這個權衡的故事，源頭是哪邊。本文章收錄三個，對於此權衡的認知升級。

2022/08/04

紫式講義的沙龍

我對精準度可解釋性權衡的三個思考：度量相關，模型族專屬，權衡的確存在

2022/08/04

中老年fc的指數化奇幻漂流

別讓統計數字騙了你（How to Lie wish Statistics)

別讓統計數字騙了你（How to Lie wish Statistics) 有內建偏差的樣本抽樣的樣本不足以代表全體，有代表性的樣本，這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果，樣本中會明顯少了總是開車出門的樣本。受訪者想要給一個會讓訪問員喜歡的答案，在

2021/10/09

中老年fc的指數化奇幻漂流

別讓統計數字騙了你（How to Lie wish Statistics)

2021/10/09

詹永裕的沙龍

點估計及不偏估計(Point Estimation and Unbiased Estimation)

點估計（point estimation）是指用樣本資料來估計母體參數，使用一個點的數值表示其估計值，因此稱為點估計。事實上我們相當常見的樣本平均數或樣本變異數就是點估計，我們是使用樣本資料計算出一個數值，然後再用這個點的數值去估計母體的參數。

#統計學

2020/08/19

詹永裕的沙龍

點估計及不偏估計(Point Estimation and Unbiased Estimation)

#統計學

2020/08/19

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News