我對可解釋性的三個思考:可解釋資訊,合規與風險權衡,詐欺機率分數

閱讀時間約 6 分鐘
圖片來源:https://nam.edu/language-interpretation-and-translation-a-clarification-and-reference-checklist-in-service-of-health-literacy-and-cultural-respect/
本文章分享閱讀關於可解釋性的文章後,產生的三個思考理解。
利用真實數據訓練,可解釋性與準確度的權衡,是很常聽到的現象。
研究的主題,則是去問說:「這個權衡,如果改成合成數據訓練的話,是否還是有這種現象?」
下面收入三個思考
  • 思考#1:可解釋性的需求,以利人類翻譯資訊
  • 思考#2:可解釋的模型和法規,不可解釋的模型風險低
  • 思考#3:可解釋性,給詐欺機率分數,然後可以快速進去看問題在哪裡

思考#1:可解釋性的需求,以利人類翻譯資訊

詐欺偵測,照講會抓出些可疑的東西,進行調查。
調查的過程,需要內容的「可解釋性」。這個意思是,對於調查的運營,要有可解釋的資訊,來論證可疑性以及後續處理。
Fraud experts need for this task to have access to the right and interpretable information for each investigated operation in order to justify the suspicion and the resulting action.
實務上是怎麼做的呢?需要問問想想。
人類需要「模型可解釋性」來理解這些事情,不然很難下判斷。
human tasks create the need for model interpretability in order to treat each alert or understand globally the evolution of fraudsters’ behavior.
這個完全沒錯,但實務上要怎麼弄,就會有很多細節。

思考#2:可解釋的模型和法規,不可解釋的模型風險低

本真可解釋的模型,能夠符合政策的限制,但對詐欺偵測而言,不夠準確,產生較高的金融風險。因此事後可解釋的方法是一個風險較低的做法。
Intrinsically interpretable models, such as ..... , are characterized by their transparency and by a self-explainable structure. They are generally applied for use cases with legal or policy constraints (Zhuang et al., 2020), but they may well be not accurate enough for tasks such as fraud detection, which have high financial stakes. This explains why more accurate black box models look appealing as soon as a post hoc interpretability method is applied to provide explanations on either how they work or on their results.
的確,風險太大要想辦法降低風險。但也是要看每個應用的風險是什麼。
但Post hoc 的可解釋性,有個很大的缺點,就是無法在模型之間公平比較。
Among these methods, some, called post-hoc specific, are specific to a type of model. ..... . The main disadvantage of the latter is that their use is restricted to a single type of model and it is therefore complicated to compare performances and explanations of several different models.
不曉得事後可解釋性,具體是怎麼操作的。可能要回答這個問題後,再去想看看合成數據是不是真的有辦法免疫這個問題。
也就是說,如果可解釋模型的表現,可以靠合成數據來變得很好,那就真的不一定要用很好的模型,風險也很低了。
也有道理。如果做線性模型,可能改數據還比改模型的效果大很多。這個就是Data-centric想法的引人之處。

思考#3:可解釋性,給詐欺機率分數,然後可以快速進去看問題在哪裡

可解釋的覆蓋:根據一些可疑的行為特徵,給出詐欺機率分數,然後分數太高的要調查。
First, an anti-fraud software, carried by the publisher Bleckwen, is developed for instant cash transfer fraud, characterized by high operation frequencies and limited human involvement. This software is based on the improvement of a black box scoring model (XGBoost), resulting in a fraud probability score, completed with a local interpretative overlay: all operations over a given optimal threshold are suspended and must be investigated.
我們目前好像沒有這種「詐欺機率分數」的概念,可以繼續去發展看看細節。

之後閱讀的清單
  1. Weerts H, Ipenburg W and Pechenizkiy M (2019) Case-Based Reasoning for Assisting Domain Experts in Processing Fraud Alerts of Black-Box Machine Learning Models. Available at https://arxiv.org/pdf/1907.03334.pdf
    4會員
    23內容數
    思考合成數據的各種原理,應用與效果。
    留言0
    查看全部
    發表第一個留言支持創作者!
    紫式講義的沙龍 的其他內容
    這篇文章記錄我讀超速文章術的三個思考與理解。 這本書之前有讀過,這次想到又拿來讀讀。讀完後感覺重點其實不太明顯,很多敘述性的冗余,但也還算有思想。但離目前我想寫的東西,還需做很多修改。 不過也是多看多想多想。隨意寫,讓讀的人有感覺,之後自己也會愈來愈進步,想到特殊的做法。 獨自的事實 數字
    今天早上想到這個問題,就是當我要介紹一個思維工具時,很詳細的話,是到什麼內容的層級? 思考#1:工具要用起來,要讓讀者真的能參與行動,造成改變 分析最近閱讀的工具書,發現他是一種資訊導向的文獻式寫作。 其針對思維工具的關鍵字,不斷給出描述,串起各種技術細節內容。 一個工具要用起來,要親身實踐。
    本文章思考最新證明的後悔界,要如何讓審稿人容易理解。 思考#1:用問題零件,讓後悔界可讀 我覺得可以用幾個分類,來把相關的Term給仔細描述。 我覺得分別從3個角度(beta, x, epsilon)出發,會讓讀者更容易消化裡面的內容。
    本文章想分享給你,我在閱讀數位寫作的22條法則後,產生的3個理解與思考。 這個月的一個聚焦目標,是仔細研究數位寫作的各種技術。 數位寫作有別於一般寫作,講究以讀者的反應為優先。 你的寫作是為了自己,為了一個具體讀者,還是為了一群想像的讀者呢?
    這篇文章想介紹給你,我閱讀內部審計(Internal Audit)相關文件以後,所產生的三個思考與理解。 這篇文章收錄了三個思考,幫助我對內部審計有很大程度認識的提升。
    本篇文章想與你分享,我閱讀「引人入勝想法慣例 (Routines for Engaging with Ideas)」後,產生的想法與理解。 這個章節下有六個慣例,仔細分析他們的目的,會發現很有意思 辨認與問出更好的問題 架構對主題的探索,以建築理解。 利用可視化聚焦描述,建築工作記憶
    這篇文章記錄我讀超速文章術的三個思考與理解。 這本書之前有讀過,這次想到又拿來讀讀。讀完後感覺重點其實不太明顯,很多敘述性的冗余,但也還算有思想。但離目前我想寫的東西,還需做很多修改。 不過也是多看多想多想。隨意寫,讓讀的人有感覺,之後自己也會愈來愈進步,想到特殊的做法。 獨自的事實 數字
    今天早上想到這個問題,就是當我要介紹一個思維工具時,很詳細的話,是到什麼內容的層級? 思考#1:工具要用起來,要讓讀者真的能參與行動,造成改變 分析最近閱讀的工具書,發現他是一種資訊導向的文獻式寫作。 其針對思維工具的關鍵字,不斷給出描述,串起各種技術細節內容。 一個工具要用起來,要親身實踐。
    本文章思考最新證明的後悔界,要如何讓審稿人容易理解。 思考#1:用問題零件,讓後悔界可讀 我覺得可以用幾個分類,來把相關的Term給仔細描述。 我覺得分別從3個角度(beta, x, epsilon)出發,會讓讀者更容易消化裡面的內容。
    本文章想分享給你,我在閱讀數位寫作的22條法則後,產生的3個理解與思考。 這個月的一個聚焦目標,是仔細研究數位寫作的各種技術。 數位寫作有別於一般寫作,講究以讀者的反應為優先。 你的寫作是為了自己,為了一個具體讀者,還是為了一群想像的讀者呢?
    這篇文章想介紹給你,我閱讀內部審計(Internal Audit)相關文件以後,所產生的三個思考與理解。 這篇文章收錄了三個思考,幫助我對內部審計有很大程度認識的提升。
    本篇文章想與你分享,我閱讀「引人入勝想法慣例 (Routines for Engaging with Ideas)」後,產生的想法與理解。 這個章節下有六個慣例,仔細分析他們的目的,會發現很有意思 辨認與問出更好的問題 架構對主題的探索,以建築理解。 利用可視化聚焦描述,建築工作記憶
    你可能也想看
    Google News 追蹤
    Thumbnail
    這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
    Thumbnail
    美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
    Thumbnail
    Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
    Thumbnail
    職務再設計在幫助員工克服工作困難,提升工作表現,主要通過輔具、設備和環境的改善來實現。對身心障礙者和中高齡員工,這些困難包括無障礙空間需求等問題。職務再設計希望公司與員工共同努力改善工作表現。政府的設備補助金額會根據企業是否真心協助員工而有所不同。我的職責是與企業溝通,確保資源用在真正需要的員工身上
    Thumbnail
    簡單紀錄一下雜事。有一點點輔導級,慎讀之。 1,「洞玄女」×瑄說: 「我才不會公開說我要戳大妖(×瑄男朋友)的××。」 事情起因是,上週我遠距研討會時,因為無聊, 就拿筆戳桌上橘貓模型的××。 ×瑄聽了,竟然說,「要戳就戳真的」。 事後她翻臉不認帳,但竟然說:
    Thumbnail
    精神分析師溫尼考特提出精神分析中的觀點,以及對違法行為和反社會行為的獨到見解。透過對治療和違法行為的討論和託寓,探討了犯罪、治療與社會情感的複雜關係。
    Thumbnail
    李明是一個敏感而內向的年輕人,他一直害怕付出真心去愛一個人。他曾經經歷過一段痛苦的感情,對方在他毫無防備的時候突然消失,讓他陷入了深深的孤獨和傷痛之中。   然而,命運似乎總是喜歡和他開玩笑。在一次偶然的機會裡,李明遇到了一位叫林婷的女孩。她溫柔善良、聰明伶俐,兩人很快就成為了好朋友。隨
    Thumbnail
    國內汽車廠零件缺料無法生產,在大環境衝擊下,車商苦有滿手訂單卻無法交車,訂車的民眾只能一等再等。汽車除了能帶給生活的便利之外,也能在當你有資金需求時,可以透過申請汽車貸款、車貸轉貸、汽車轉增貸取得一筆資金來,想知道的汽車貸款問題可以透過以下解答。
    Thumbnail
    既真實又虛幻、既快速又緩慢﹍﹍ ⏰⏰⏰用一本書,探尋《韋氏字典》耗費1,700字定義的單詞—— 「時間」(time)——的真實樣貌⏰⏰⏰ ★美國書籍評論網站Book Riot「時間」主題之最佳非文學書籍 ★《出版人週刊》星號書評 ★英國皇家學會院士、暢銷書作者作者 伊恩・史都華  推薦
    Thumbnail
    25歲生日快樂。我在心裡輕輕地對自己說。 每次過生日時,都覺得慶生的意義在於證明自己又度過了365天的里程碑。除了感謝親朋好友的祝福,同時也感謝生命帶來的每個課題和養分,讓未來一年的自己有機會持續探索世界和學習新知 。 25歲說長不長,說短不短。在這之間的體悟難以用三言兩語道盡...
    Thumbnail
    撰文 / IPOWER培力學社吉祥物老蘇   根據行政院國情統計通報,全台灣社會團體數108年時已經達到快6萬個,而其中社會服務及慈善類型居冠占了3成之多,針對不同服務對象(弱勢群體、婦女、老人、身心障礙...等)或不同社會議題(偏鄉、環境、特殊疾病...等)有不同的行動及倡議方式...
    Thumbnail
    這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
    Thumbnail
    美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
    Thumbnail
    Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
    Thumbnail
    職務再設計在幫助員工克服工作困難,提升工作表現,主要通過輔具、設備和環境的改善來實現。對身心障礙者和中高齡員工,這些困難包括無障礙空間需求等問題。職務再設計希望公司與員工共同努力改善工作表現。政府的設備補助金額會根據企業是否真心協助員工而有所不同。我的職責是與企業溝通,確保資源用在真正需要的員工身上
    Thumbnail
    簡單紀錄一下雜事。有一點點輔導級,慎讀之。 1,「洞玄女」×瑄說: 「我才不會公開說我要戳大妖(×瑄男朋友)的××。」 事情起因是,上週我遠距研討會時,因為無聊, 就拿筆戳桌上橘貓模型的××。 ×瑄聽了,竟然說,「要戳就戳真的」。 事後她翻臉不認帳,但竟然說:
    Thumbnail
    精神分析師溫尼考特提出精神分析中的觀點,以及對違法行為和反社會行為的獨到見解。透過對治療和違法行為的討論和託寓,探討了犯罪、治療與社會情感的複雜關係。
    Thumbnail
    李明是一個敏感而內向的年輕人,他一直害怕付出真心去愛一個人。他曾經經歷過一段痛苦的感情,對方在他毫無防備的時候突然消失,讓他陷入了深深的孤獨和傷痛之中。   然而,命運似乎總是喜歡和他開玩笑。在一次偶然的機會裡,李明遇到了一位叫林婷的女孩。她溫柔善良、聰明伶俐,兩人很快就成為了好朋友。隨
    Thumbnail
    國內汽車廠零件缺料無法生產,在大環境衝擊下,車商苦有滿手訂單卻無法交車,訂車的民眾只能一等再等。汽車除了能帶給生活的便利之外,也能在當你有資金需求時,可以透過申請汽車貸款、車貸轉貸、汽車轉增貸取得一筆資金來,想知道的汽車貸款問題可以透過以下解答。
    Thumbnail
    既真實又虛幻、既快速又緩慢﹍﹍ ⏰⏰⏰用一本書,探尋《韋氏字典》耗費1,700字定義的單詞—— 「時間」(time)——的真實樣貌⏰⏰⏰ ★美國書籍評論網站Book Riot「時間」主題之最佳非文學書籍 ★《出版人週刊》星號書評 ★英國皇家學會院士、暢銷書作者作者 伊恩・史都華  推薦
    Thumbnail
    25歲生日快樂。我在心裡輕輕地對自己說。 每次過生日時,都覺得慶生的意義在於證明自己又度過了365天的里程碑。除了感謝親朋好友的祝福,同時也感謝生命帶來的每個課題和養分,讓未來一年的自己有機會持續探索世界和學習新知 。 25歲說長不長,說短不短。在這之間的體悟難以用三言兩語道盡...
    Thumbnail
    撰文 / IPOWER培力學社吉祥物老蘇   根據行政院國情統計通報,全台灣社會團體數108年時已經達到快6萬個,而其中社會服務及慈善類型居冠占了3成之多,針對不同服務對象(弱勢群體、婦女、老人、身心障礙...等)或不同社會議題(偏鄉、環境、特殊疾病...等)有不同的行動及倡議方式...