對數轉換(Logarithmic Transformation)是將數據中的每個值轉換為其對數值的過程,常用於數據分析和機器學習中,以改善數據分佈、降低偏態,並使數據更接近常態分布。
對數轉換的主要目的
- 減少偏態(Skewness):將右偏分佈的數據拉近對稱,有利於統計模型的假設;
- 縮小數據範圍:將較大的數值壓縮,使數據範圍變窄,便於建模;
- 穩定變異數:減少異方差性,提高模型效果;
- 處理異常值:高值被壓縮到比原始值更低的比率,弱化極端值影響。
- 自然對數
- 常用對數
- 其他底數對數
注意事項
- 對數僅能作用於正數,數據中有0或負數時,需先進行平移或選擇其他變換;
- 對數轉換後結果需注意解釋與回轉(如指數轉換回原單位);
- 有時與Box-Cox或Yeo-Johnson轉換結合使用,適合更廣泛數據。
應用案例
- 對收入、人口、面積等呈指數變化的變數進行轉換;
- 資料可視化時減少極端值的拉伸影響;
- 改善統計檢驗與迴歸模型的前提條件。
簡言之,對數轉換是一種常見的資料前處理方法,透過將數據轉成對數值,幫助提升模型效果和數據分析的穩定性與解釋力。