資料增強 (Data Augmentation)

2025/08/08 更新2025/05/27 發佈閱讀 5 分鐘

資料增強 (Data Augmentation) 是一種在機器學習和深度學習中常用的提高模型泛化能力和魯棒性的技術。它的核心思想是通過對現有的訓練數據進行隨機的、合理的變換，生成更多樣化的訓練樣本。這樣做的目的是讓模型在訓練過程中接觸到更多不同的數據變異情況，從而減少過擬合的風險，並提升模型在未見過的新數據上的表現。

為什麼需要資料增強？

擴充有限的數據集: 在很多實際應用中，獲取大量的標註數據非常困難且昂貴。資料增強可以有效地擴充有限的訓練數據集，增加模型的訓練樣本數量。
提高模型的泛化能力: 通過引入各種數據變異，模型可以學會識別物體或模式在不同條件下的表現，從而減少對特定訓練數據的過度依賴，提高在真實世界數據上的泛化能力。
增強模型的魯棒性: 資料增強可以幫助模型對輸入數據中的微小變化（例如：光照、角度、尺度變化）更加魯棒。
減少過擬合: 過擬合是指模型在訓練數據上表現非常好，但在測試數據或新數據上的表現很差。資料增強可以有效地幫助模型學習更具代表性的特徵，從而降低過擬合的風險。

常見的資料增強技術（以圖像數據為例，因為之前的討論都集中在電腦視覺）：

幾何變換 (Geometric Transformations):
- 翻轉 (Flipping): 水平翻轉、垂直翻轉。
- 旋轉 (Rotation): 將圖像按一定角度（例如：±10度、±30度）旋轉。
- 縮放 (Scaling): 放大或縮小圖像。
- 裁剪 (Cropping): 從圖像中隨機裁剪出一部分區域，並將其調整到原始尺寸。
- 平移 (Translation): 在圖像平面上沿水平或垂直方向移動圖像。
- 透視變換 (Perspective Transformation): 改變圖像的視角。
色彩空間變換 (Color Space Transformations):
- 亮度調整 (Brightness Adjustment): 增加或減少圖像的亮度。
- 對比度調整 (Contrast Adjustment): 調整圖像中不同區域之間的對比度。
- 飽和度調整 (Saturation Adjustment): 調整圖像的色彩飽和度。
- 色調調整 (Hue Adjustment): 改變圖像的整體顏色色調。
- 通道混合 (Channel Shuffling): 隨機交換圖像的不同顏色通道（例如：RGB）。
核方法 (Kernel Methods) / 濾波器 (Filters):
- 模糊 (Blurring): 應用高斯模糊或其他模糊濾鏡。
- 銳化 (Sharpening): 增強圖像的邊緣和細節。
隨機雜訊 (Random Noise):
- 高斯雜訊 (Gaussian Noise): 向圖像像素添加服從高斯分佈的隨機雜訊。
- 椒鹽雜訊 (Salt and Pepper Noise): 隨機將一些像素設置為白色或黑色。
混合 (Mixing):
- Mixup: 將兩張隨機選擇的訓練圖像按一定比例混合，同時也混合它們的標籤。
- CutMix: 從訓練圖像中隨機裁剪一個區域，並用另一張訓練圖像的相同區域替換，標籤也按裁剪區域的比例進行混合。
生成對抗網路 (GAN) 的應用:
- 有時會使用訓練好的 GAN 模型來生成更多逼真的訓練樣本。

注意事項：

保持標籤一致性: 在進行資料增強時，需要確保圖像的標籤與變換後的圖像仍然對應。例如，如果水平翻轉了一張包含貓的圖像，其標籤仍然應該是「貓」。
增強的合理性: 進行的增強應該是合理的，即變換後的圖像仍然屬於真實數據的分布範圍內。例如，對於手寫數字識別，將數字旋轉 180 度可能不再是同一個數字了。
增強的強度: 資料增強的強度需要仔細調整，過度的增強可能會引入與真實數據不符的樣本，反而降低模型性能。
測試集不進行增強: 資料增強通常只應用於訓練集，以擴充訓練數據並提高模型的泛化能力。測試集應該保持原始狀態，以評估模型在真實未見過數據上的性能。

總之，資料增強是一種強大且常用的技術，可以有效地提高深度學習模型的性能，尤其是在數據量有限的情況下。通過創造更多樣化的訓練數據，模型可以學習到更穩健的特徵，並在實際應用中表現得更好。

含 AI 應用內容