DP 001|如何評估你算法的成員推論風險?

更新於 發佈於 閱讀時間約 1 分鐘

今天聊一聊由Tobias Leemann[1] 所著作的,


《Gaussian Membership Inference Privacy》[2]。


這篇文章,


推薦給想了解「成員推論攻擊 Membership Inference Attack」,


相關理論的研究人員,


因為這篇文章示範了如何結合「成員推論攻擊」與「隨機梯度下降」。


在本文章的3.2節,其提供了一個假設檢定的框架,


來描述什麼是「成員推論隱私 Membership Inference Privacy」。


在定義3.1 描述的「成員攻擊實驗 Membership Inference Experiment」中,


攻擊者關心的「目標個體 Target Individual」,


可能來自算法的訓練集中個一個數據點,


也可能來自同樣算法訓練數據分佈的其他數據點。


攻擊者的目的,是發展出一種方式,


能夠可靠辨認出特定的數據點,


是否包含於目前算法的訓練數據中,


以此來窺探算法的訓練數據隱私。


有另外一類的研究,叫做數據拷貝,


則是直接觀察算法的輸出,


看看算法輸出是否有過於靠近訓練數據的情形。


這種數據拷貝的觀察,


也能轉成另一種成員推論攻擊的形式。


總之,由於「隱私保持機器學習 Privacy-Preserving Machine Learning」的目的是保護「個人數據 Personal Data」,


因此我們需要研究一個機器學習算法,


被成員推論攻擊下產生的隱私風險,


藉此來度量個人數據遭洩露的機率。


Reference

[1] https://scholar.google.com/citations?user=VsNjvo0AAAAJ&hl=de

[2] https://arxiv.org/pdf/2306.07273

avatar-img
532會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
1. 制定嚴謹的工作節奏: - 在 UCLA 擔任博士後研究員的這兩年,我制定了嚴謹的工作節奏,具體來說,我的工作週期是週日到週四工作,週五週六休息。每天的工作時間是從早上 8:30 到下午 3:30,共 7 個小時。這樣每天 7 小時,一週累積 35 小時的高強度專注工作,使我能夠達到高效率和高
今天聊聊 Marc Abeille[1] 所著作的《Linear Thompson Sampling Revisited》[2]。 這篇文章是分析Linear Thompson Sampling的理論經典文章。 文章裡面示範了如何將 Thompson取樣, 看作是一種對參數的擾動,
1. 追求整本書讀完 - 很多學生會執著於把整本書從頭到尾讀完,卻忽略了是否真正吸收了書中的重要知識點。這種追求完美的閱讀方式容易讓人感到壓力,反而無法從閱讀中獲得真正的啟發與樂趣。其實,與其專注於讀完每一頁,不如專注於書中對你有啟發的部分,這樣才能更有效地利用你的時間和精力。 2.
你學習任何數學, 都要問這哪個部分是微積分長出來的, 哪個部分是線性代數長出來的。 當然,你需要先把微積分與線性代數學一次, 知道裡面有哪些內容, 接下來學任何新的東西,其實都是微積分跟線性代數。
當面對失敗時,我們本能上會感到厭惡。這種厭惡感讓我們害怕失敗,進而避免去嘗試新的挑戰。然而,成功的人往往能克服這種厭惡,勇於面對失敗,從中學習並改進。學會克服這種厭惡感,是成長的重要一步。厭惡失敗是人類的本能反應,但我們可以透過心理訓練和實踐,不斷減少這種厭惡感,進而更積極地面對挑戰。
Nick Milo 的寫作都很隨性, 很難看到他對自己的用字有比較準確的定義, 導致我雖然加入社群很久了, 但總覺得他每次講的東西都跟上次不一樣。 不過Nick Milo 這種不嚴謹的習慣, 也讓他每次都能跑出一些意料之外的想法, 每次的工作坊都能學到蠻多有趣的概念。
1. 制定嚴謹的工作節奏: - 在 UCLA 擔任博士後研究員的這兩年,我制定了嚴謹的工作節奏,具體來說,我的工作週期是週日到週四工作,週五週六休息。每天的工作時間是從早上 8:30 到下午 3:30,共 7 個小時。這樣每天 7 小時,一週累積 35 小時的高強度專注工作,使我能夠達到高效率和高
今天聊聊 Marc Abeille[1] 所著作的《Linear Thompson Sampling Revisited》[2]。 這篇文章是分析Linear Thompson Sampling的理論經典文章。 文章裡面示範了如何將 Thompson取樣, 看作是一種對參數的擾動,
1. 追求整本書讀完 - 很多學生會執著於把整本書從頭到尾讀完,卻忽略了是否真正吸收了書中的重要知識點。這種追求完美的閱讀方式容易讓人感到壓力,反而無法從閱讀中獲得真正的啟發與樂趣。其實,與其專注於讀完每一頁,不如專注於書中對你有啟發的部分,這樣才能更有效地利用你的時間和精力。 2.
你學習任何數學, 都要問這哪個部分是微積分長出來的, 哪個部分是線性代數長出來的。 當然,你需要先把微積分與線性代數學一次, 知道裡面有哪些內容, 接下來學任何新的東西,其實都是微積分跟線性代數。
當面對失敗時,我們本能上會感到厭惡。這種厭惡感讓我們害怕失敗,進而避免去嘗試新的挑戰。然而,成功的人往往能克服這種厭惡,勇於面對失敗,從中學習並改進。學會克服這種厭惡感,是成長的重要一步。厭惡失敗是人類的本能反應,但我們可以透過心理訓練和實踐,不斷減少這種厭惡感,進而更積極地面對挑戰。
Nick Milo 的寫作都很隨性, 很難看到他對自己的用字有比較準確的定義, 導致我雖然加入社群很久了, 但總覺得他每次講的東西都跟上次不一樣。 不過Nick Milo 這種不嚴謹的習慣, 也讓他每次都能跑出一些意料之外的想法, 每次的工作坊都能學到蠻多有趣的概念。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
可能包含敏感內容
想學流量怎麼蹭嗎?讓我這位前任競選總幹事告訴你,不過要先修課程唷,我會給素材,你們要交作業,否則紙上談兵都無用,我有一些業配的業務可以讓各位練習,如何蹭流量還有管理經營。 流量密碼研究所 3000,每個月 https://vocus.cc/pay/salon/monthly/645345c1
Thumbnail
本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據,數據的清洗和結構化處理,知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議,歡迎隨時告訴我們,讓我們共同探索,攜手進步。
Thumbnail
在社群平臺上,一切的可見度都受到演算法控制,想要增加曝光就必須深入瞭解演算法的運作方式。本篇文章將透過說明演算法的運作方式以及狙擊演算法的第一步:HOOK來提供一些策略,協助創作者應對平臺演算法的變化。
Thumbnail
這本書討論了數據應用中的暗數據,探討了遺漏的資訊或數據對數據分析的影響。書中列舉了很多有趣的例子,但同時也提到暗數據仍具有價值和發現真相的可能。對於對調查研究有興趣的讀者來說很有價值,需要具備一定的統計基礎。作者強調懷疑數據的重要性,以避免暗數據的影響。
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
對於這個標題呢? 我相信應該很多人都會疑惑? 這是什麼意思? 很多時候... 自己會用預估的,方式來對自身進行一種審視...? 這有點像是,玩網路遊戲的時候? 將角色創立後,可以看到人物的數據面板那樣。 自己同樣也會使用,這樣的方式來進行自我的審視... 雖然現實可能
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
可能包含敏感內容
想學流量怎麼蹭嗎?讓我這位前任競選總幹事告訴你,不過要先修課程唷,我會給素材,你們要交作業,否則紙上談兵都無用,我有一些業配的業務可以讓各位練習,如何蹭流量還有管理經營。 流量密碼研究所 3000,每個月 https://vocus.cc/pay/salon/monthly/645345c1
Thumbnail
本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據,數據的清洗和結構化處理,知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議,歡迎隨時告訴我們,讓我們共同探索,攜手進步。
Thumbnail
在社群平臺上,一切的可見度都受到演算法控制,想要增加曝光就必須深入瞭解演算法的運作方式。本篇文章將透過說明演算法的運作方式以及狙擊演算法的第一步:HOOK來提供一些策略,協助創作者應對平臺演算法的變化。
Thumbnail
這本書討論了數據應用中的暗數據,探討了遺漏的資訊或數據對數據分析的影響。書中列舉了很多有趣的例子,但同時也提到暗數據仍具有價值和發現真相的可能。對於對調查研究有興趣的讀者來說很有價值,需要具備一定的統計基礎。作者強調懷疑數據的重要性,以避免暗數據的影響。
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
對於這個標題呢? 我相信應該很多人都會疑惑? 這是什麼意思? 很多時候... 自己會用預估的,方式來對自身進行一種審視...? 這有點像是,玩網路遊戲的時候? 將角色創立後,可以看到人物的數據面板那樣。 自己同樣也會使用,這樣的方式來進行自我的審視... 雖然現實可能