郝信華 iPAS AI應用規劃師學習筆記

異常值的檢測方法

iPAS AI應用規劃師學習筆記

發佈於數據準備與模型選擇

2025/09/02 更新2025/09/02 發佈閱讀 2 分鐘

異常值的檢測方法主要可分為統計方法、機器學習方法和基於距離或密度的方法，這些方法能幫助識別數據中偏離正常模式的點，常用於資料清理、風險控制及異常事件偵測。

常見異常值檢測方法：

1. 統計方法

• Z-Score標準化：計算數據點距離平均值的標準差距離，通常超過3倍標準差的被視為異常。

• 四分位數範圍法（IQR）：計算上四分位數（Q3）和下四分位數（Q1）之間的距離，凡超過或的數據點視為異常。

• 假設檢驗：基於特定分布假設檢驗數據點是否符合該分布。

2. 距離和密度方法

• 最近鄰距離（k-NN）：計算數據點與其最近鄰的距離，距離大者判定為異常。

• 局部離群因子（LOF）：評估點密度相對於其鄰居的密度，密度明顯較低的為異常值。

3. 機器學習方法

• 孤立森林（Isolation Forest）：透過隨機切割數據以孤立異常點，異常點被孤立的平均步驟較少。

• 支持向量機異常檢測（One-Class SVM）：找出包圍正常數據的超平面，外部點為異常。

• 自編碼器（Autoencoder）：利用神經網絡重建數據，重建誤差高的點被視為異常。

• 時間序列異常檢測：對於時序數據，利用趨勢、季節性分解及預測誤差來識別異常。

檢測異常值的挑戰：

• 特徵選取難題，異常值的表現形式多樣。

• 正常與異常邊界不明確。

• 標記資料缺乏，異常資料稀少。

• 資料噪聲和動態變化影響檢測準確度。

簡單比喻：

異常檢測就像是在一大群人中找出不合群的那幾個特別的“奇葩”，方法多樣且各有側重。

總結：

異常值檢測方法包括統計指標、距離密度評估與多種機器學習技術，根據特定應用與數據類型選擇合適方法，以精準識別與處理異常數據。

含 AI 應用內容

#數據準備與模型選擇

郝信華 iPAS AI應用規劃師學習筆記數據準備與模型選擇

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

27會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

統計急救箱的沙龍

統計急救箱─抽樣分布與標準誤

　　前面說明了所謂「假設檢定」的邏輯，也就是推論統計的基礎。但前面都還只是概念的階段，目前沒有真正進行任何的操作──還沒有提到推論統計的技術。　　這篇其實有點像是一個過渡，是將前面的概念銜接到下一篇t分數之間的過程，也可以說是稍微解釋一下t檢定怎麼發展出來的。

#統計急救箱#統計學#常態分布

2024/04/28

統計急救箱的沙龍

統計急救箱─抽樣分布與標準誤

　　前面說明了所謂「假設檢定」的邏輯，也就是推論統計的基礎。但前面都還只是概念的階段，目前沒有真正進行任何的操作──還沒有提到推論統計的技術。　　這篇其實有點像是一個過渡，是將前面的概念銜接到下一篇t分數之間的過程，也可以說是稍微解釋一下t檢定怎麼發展出來的。

#統計急救箱#統計學#常態分布

2024/04/28

教育心理博士的筆記本

讀懂調查報告：樣本和母體

選舉民調是預測選舉結果的重要工具。然而，如果我們不了解樣本和母體的概念，就很容易被民調結果誤導。在本文中，我們將介紹樣本和母體的概念，以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。

#統計#數據#地區

2024/04/02

教育心理博士的筆記本

讀懂調查報告：樣本和母體

選舉民調是預測選舉結果的重要工具。然而，如果我們不了解樣本和母體的概念，就很容易被民調結果誤導。在本文中，我們將介紹樣本和母體的概念，以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。

#統計#數據#地區

2024/04/02

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（下）

接續上一篇，繼續來講如何從常態分布的機率進行假設檢定，進而推論母體的平均數吧！這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。

#統計#統計學#社會科學

2024/03/10

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（下）

接續上一篇，繼續來講如何從常態分布的機率進行假設檢定，進而推論母體的平均數吧！這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。

#統計#統計學#社會科學

2024/03/10

Martin Chiu的沙龍

選票驗偽統計分析的正當性與證據力

　當開啟試算表（EXCEL等）的累加（SUM）及離散度，標準差（STDEV）的運算功能後，逐一統計的累進報票式選票統計表就可以退休了，而且全國一萬七千多所的數據不待一所所列出，就可以用較小選區（例如嘉義市198所，宜蘭縣431所等）的統計過程證明統計結果都是正確的，尤其是將計算式列出（隱藏前面的

2024/02/26

Martin Chiu的沙龍

選票驗偽統計分析的正當性與證據力

　當開啟試算表（EXCEL等）的累加（SUM）及離散度，標準差（STDEV）的運算功能後，逐一統計的累進報票式選票統計表就可以退休了，而且全國一萬七千多所的數據不待一所所列出，就可以用較小選區（例如嘉義市198所，宜蘭縣431所等）的統計過程證明統計結果都是正確的，尤其是將計算式列出（隱藏前面的

2024/02/26

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（上）

　　在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率，而更之前也看過了抽樣分布是如何形成常態分布的過程，現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。

#統計急救箱#統計學#社會科學

2024/01/21

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（上）

　　在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率，而更之前也看過了抽樣分布是如何形成常態分布的過程，現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。

#統計急救箱#統計學#社會科學

2024/01/21

統計急救箱的沙龍

統計急救箱─常態分布與機率

依照中央極限定理，我們可以得知（獨立且隨機樣本的）抽樣分布最終會形成常態分佈，那麼這件事情到底為什麼很重要呢？這篇文章就來介紹一些常態分布的基本特性，以及最重要的──常態分布怎麼幫助我們計算機率。

#統計#統計學#社會科學

2023/12/25

統計急救箱的沙龍

統計急救箱─常態分布與機率

依照中央極限定理，我們可以得知（獨立且隨機樣本的）抽樣分布最終會形成常態分佈，那麼這件事情到底為什麼很重要呢？這篇文章就來介紹一些常態分布的基本特性，以及最重要的──常態分布怎麼幫助我們計算機率。

#統計#統計學#社會科學

2023/12/25

股市觀察家的沙龍

三個臭皮匠勝過一個諸葛亮

由醜媳婦總是要見公婆-績效報表的最佳化報表可知，無論我們將連續創高或創低的K棒數如何改變，均不可能讓淨利變正，代表我們不可能靠單一個指標值來獲利，此時改善方式只能再回到觀察圖表，由圖表中的訊號觀察是否有什麼改善方式。由圖表中可發現當標示的紅點或綠點離均線越遠，則進場的時機點越好，如果可以增加

#程式交易#MultiCharts#策略改善

2023/11/08

股市觀察家的沙龍

三個臭皮匠勝過一個諸葛亮

由醜媳婦總是要見公婆-績效報表的最佳化報表可知，無論我們將連續創高或創低的K棒數如何改變，均不可能讓淨利變正，代表我們不可能靠單一個指標值來獲利，此時改善方式只能再回到觀察圖表，由圖表中的訊號觀察是否有什麼改善方式。由圖表中可發現當標示的紅點或綠點離均線越遠，則進場的時機點越好，如果可以增加

#程式交易#MultiCharts#策略改善

2023/11/08

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News