Adversarial Attacks（對抗性攻擊）

iPAS AI應用規劃師學習筆記

發佈於AI風險管理

2025/08/28 更新2025/08/28 發佈閱讀 4 分鐘

Adversarial Attacks（對抗性攻擊）是在機器學習和人工智慧領域中，攻擊者透過對輸入數據進行微小且精心設計的擾動，使得模型產生錯誤判斷或錯誤預測的一種攻擊方式。這些擾動對人類來說幾乎不可察覺，但卻足以誤導模型。

Adversarial Attacks的定義與原理：

• 攻擊者給模型輸入被修改過的數據（稱為對抗樣本），誘使模型輸出錯誤結果，如錯誤分類或錯誤識別。

• 擾動極小，但對模型卻有重大影響，因模型對輸入數據的特定模式非常敏感。

• 攻擊可以在訓練階段（數據投毒）或部署階段（規避檢測）實施。

主要類型：

• 對抗性樣本（Adversarial Examples）：通過對原始數據微調產生，攻擊模型。

• 逃避攻擊（Evasion Attacks）：修改輸入使模型無法正確檢測或分類。

• 數據投毒（Poisoning Attacks）：向訓練資料中注入惡意數據，改變模型行為。

• 模型竊取（Model Extraction）：盜用模型敏感信息，仿製模型。

影響與風險：

• 導致自動駕駛車輛誤判交通標誌，造成安全事故。

• 醫療影像診斷系統錯誤診斷病情。

• 臉部識別系統被欺騙，造成安全漏洞。

• 影響信任和應用普及，對AI安全提出挑戰。

防禦方法：

• 對抗訓練（在訓練時加入對抗樣本提升模型魯棒性）。

• 輸入數據的檢測和過濾。

• 使用防禦性蒸餾等技術加強模型穩健性。

簡單比喻：

Adversarial Attacks就像是在圖畫上輕輕添加一點點錯誤的筆觸，讓人眼看不出來，但卻讓AI錯誤識別畫中的內容。

總結：

Adversarial Attacks是以微小但針對性的數據擾動誤導機器學習模型做出錯誤決策的攻擊，對AI系統的安全性構成重大威脅，需採取專門技術加以防範。Adversarial Attacks（對抗性攻擊）是在機器學習中，攻擊者故意對輸入數據做出微小且精心設計的擾動，使得模型產生錯誤預測或錯誤判斷。這些擾動對人類觀察者而言幾乎不可察覺，但能有效誤導AI系統。

定義與原理

• 攻擊者以微小變化改變輸入數據（稱為對抗樣本），使模型產生錯誤結果，如將圖像錯誤分類。

• 攻擊可發生在模型訓練階段（數據投毒）或部署階段（逃避式攻擊）。

• 透過對模型敏感輸入的微調，達成迷惑和誤導模型的目的。

主要攻擊類型

• 對抗樣本（Adversarial Examples）：帶有細微噪聲的數據，誘導模型錯誤判斷。

• 逃避攻擊（Evasion Attack）：修改輸入避開檢測系統，如垃圾郵件或惡意軟體。

• 數據投毒（Poisoning Attack）：污染訓練數據，破壞模型學習表現。

• 模型竊取（Model Extraction）：盜用模型機密資料。

影響

• 可能導致自駕車誤判道路標誌。

• 醫療影像診斷錯誤。

• 臉部識別系統被欺騙等安全問題。

防禦策略

• 對抗訓練（在訓練資料加入對抗樣本）。

• 輸入檢測和數據淨化。

• 防禦性模型設計和監控。

簡單比喻：

像是在圖片上加上一層透明的「錯誤墨水」，肉眼難見但能讓AI誤判。

總結：

Adversarial Attacks是通過細微欺騙輸入數據，讓機器學習模型作出錯誤判斷的攻擊，對AI安全構成重大挑戰，需採用專門技術防範。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AI風險管理

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

22會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/08/28

Membership Inference（成員推斷攻擊）

Membership Inference（成員推斷攻擊）是一種針對機器學習模型的隱私攻擊，攻擊者試圖判斷一條特定數據是否被用於訓練該機器學習模型。簡言之，攻擊者想知道某個人的數據是否包含在訓練資料集中，這可能導致敏感個人資訊洩露。 Membership Inference的定義： • 攻擊者透

2025/08/28

Membership Inference（成員推斷攻擊）

2025/08/28

Equal Opportunity（平等機會）

Equal Opportunity（平等機會）是指在教育、就業及其他領域中，所有人不論其種族、性別、年齡、宗教、社會經濟地位等背景，都應享有同等的資源、機會和待遇，以公平的標準進行競爭和發展。 Equal Opportunity的定義與核心原則： • 強調消除人工障礙、偏見和不公平偏好，確保不

2025/08/28

Equal Opportunity（平等機會）

2025/08/28

Demographic Parity（人口統計平等）

Demographic Parity（人口統計平等）是一種公平性指標，旨在確保不同包含敏感屬性（如種族、性別、年齡等）群體獲得正面結果的機率相等。在決策系統中，達到Demographic Parity意味著系統的正面輸出（例如貸款批准、工作錄取）不應依賴於被保護群體的身份特徵。 Demograph

2025/08/28

Demographic Parity（人口統計平等）

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

#懶人料理#食譜#健康甜點

2025/10/15

烏托邦邦的沙龍

『人工智能』AI的崛起早已對人類產生威脅？！

人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.

#人工智能#ai#科技

2024/08/06

烏托邦邦的沙龍

『人工智能』AI的崛起早已對人類產生威脅？！

#人工智能#ai#科技

2024/08/06

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

人工智慧是什麼？人工智慧（Artificial Intelligence, AI）簡單來說，就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序，可以執行許多原本需要人類智慧才能完成的工作，例如：語音辨識：讓電腦聽懂人類的語言，像是 Siri、Google As

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

錡So

傳統勒索攻擊與人工智慧驅動的攻擊，有何不同之處呢?

人工智慧驅動的勒索軟體攻擊實際上與普通勒索軟體攻擊沒有什麼不同，只是它做得更好,這些攻擊媒介旨在對他們的目標進行社交工程，使其點擊它們；過去，您必須注意拼寫錯誤才能識別垃圾郵件。現在人工智慧被用來生成這些電子郵件，語法是完美的，更容易欺騙受害者。人工智慧驅動的勒索軟體也適應其環境，並有可能識別現有的

#AI#深度學習#資訊安全

2024/07/22

錡So

傳統勒索攻擊與人工智慧驅動的攻擊，有何不同之處呢?

#AI#深度學習#資訊安全

2024/07/22

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19