特徵縮放的常用方法主要有以下幾種:
- 最小最大縮放(Min-Max Scaling)
將特徵值縮放到固定範圍(通常是0到1之間),計算公式是

- 。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合,但對極端值敏感。
- 標準化(Standardization)
將特徵值的平均數轉為0,標準差轉為1,計算公式是

- ,其中 μμ為均值,σσ為標準差。適用於數據接近正態分佈,常用於支持向量機、邏輯回歸等模型。
- 魯棒縮放(Robust Scaling)
利用中位數和四分位距縮放,減少異常值影響,計算公式為

- 。適用於有不少離群點的數據。
- 均值縮放(Mean Normalization)
透過將特徵均值置為0並按最大值和最小值範圍縮放,計算公式是

- ,適用於數據分佈不均且希望中心化的情況。
- 正規化(Normalization)
將特徵向量縮放為單位長度,使整個向量長度為1,常用於計算距離的算法。
這些方法可統一特徵量級,使模型訓練更穩定且加速梯度下降收斂,提升模型準確性。選擇適當的縮放方法,依據資料分佈特性和模型需求決定.












