特徵尺度的統一:為什麼是模型的「生存法則」?

更新 發佈閱讀 5 分鐘

在現實世界的資料中,「年齡」可能以 10 到 100 為單位,「年收入」卻以 50 萬到 1000 萬為單位。如果直接將這兩組數值輸入模型,數值範圍巨大的特徵將會在數學上完全主導模型的判斷,使得數值範圍小的特徵形同虛設,這就是我們常說的「尺度霸凌」現象。

特徵縮放(Feature Scaling),無論是正規化(Normalization) 將數值轉換至區間,或是標準化(Standardization) 將數值轉換為 μ=0,σ=1 的分佈,目的都是在統一量級,確保所有特徵維度對模型的貢獻是公平且穩定的。

這種統一之所以關鍵,是因為它解決了三類核心模型學習機制上的偏差:

1. 核心機制:距離計算的扭曲 (Distance Distortion)

許多機器學習模型在決策時,高度依賴於樣本點之間的 幾何距離 來判斷相似性或劃分邊界。如果特徵尺度差異過大,距離計算將被高尺度的特徵所支配,進而導致判斷結果失真。

代表模型: K-最近鄰 (KNN)支持向量機 (SVM)

底層邏輯:

    ◦ KNN 透過計算新樣本與所有訓練樣本的距離(例如歐幾里得距離),來找到最接近的 K 個鄰居,並進行分類或迴歸。當某一特徵的數值範圍比其他特徵大數百倍時,距離的計算將幾乎完全由該高尺度特徵決定,低尺度的特徵將失去判斷相似性的能力。因此,KNN 對特徵尺度是高度敏感的,必須進行特徵縮放。

    ◦ SVM 的目標是找到最大化類別間隔(Margin)的超平面。這個超平面的位置和間隔的計算,同樣對特徵的量級敏感。標準化處理能夠幫助 SVM 更好地找到這個最大間隔,並提升其在高維空間中的表現和訓練效率。

2. 核心機制:梯度下降的不穩 (Gradient Instability)

許多模型,尤其是採用迭代優化方法(如梯度下降)來更新模型參數(權重)時,特徵的尺度會直接影響優化過程的效率與穩定性。

代表模型: 線性迴歸 (Linear Regression)邏輯迴歸 (Logistic Regression) 以及所有的 深度神經網路 (Deep Neural Networks)。

底層邏輯:

    ◦ 梯度下降依賴計算損失函數對每個參數的偏導數(即梯度)來調整權重。如果一個特徵的數值範圍很大,它對損失函數的貢獻(梯度)也會更大。

    ◦ 在優化過程中,這會導致模型在對應高尺度特徵的維度上,權重更新的步伐過大,產生劇烈震盪或發散;而在低尺度特徵的維度上,權重更新卻緩慢無力,難以收斂至最佳解。

    ◦對於這類模型,特徵縮放(特別是標準化至 μ=0,σ=1)是不可或缺的前處理步驟。在深度學習中,類似的機制如層歸一化(Layer Normalization) 也是為了穩定訓練過程中的數據分佈,避免內部協變偏移,提升收斂速度。

3. 核心機制:權重懲罰的偏差 (Regularization Bias)

在加入正則化項(Regularization Term)以防止模型過度擬合(Overfitting)時,特徵尺度會破壞懲罰機制的公平性。

代表模型: Lasso 迴歸 (L1 正則化)Ridge 迴歸 (L2 正則化)

底層邏輯:

    ◦ 正則化項通過懲罰模型權重(係數 β)的大小來限制模型的複雜度。例如,L2 正則化會最小化 ∑βj2​。

    ◦ 如果特徵 XA​ 的數值很大,模型為了保持預測結果 Y 不變,會賦予 XA​ 一個非常小的權重 βA​。反之,數值小的特徵 XB​ 會獲得一個相對大的權重 βB​。

    ◦ 當我們對權重進行懲罰時,L2 懲罰項 ∑β2 會不成比例地壓縮權重較大的 βB​(即對應低尺度特徵的權重),導致正則化的效果偏向懲罰低尺度的特徵,而非公正地懲罰所有權重。

    ◦ 為了讓正則化能夠基於特徵的實際重要性而非其數值大小進行懲罰,我們必須先將特徵縮放到同一尺度。

--------------------------------------------------------------------------------

簡單來說,特徵必須統一尺度,是因為所有依賴「距離」或「梯度」的機器學習模型,都要求所有輸入特徵在數學上具有公平的「發言權」;如果不縮放,數值最大的特徵就會在模型訓練中造成數據「霸凌」與訓練「震盪」!

留言
avatar-img
留言分享你的想法!
avatar-img
iPAS AI 自學路
15會員
61內容數
我是一位正在追求職涯升級的 40 歲非本科系上班族。我會將自己摸索出的高效白話筆記與聽覺學習法無私分享,助你:克服術語障礙、利用零碎時間學習、系統化整理考點。 也歡迎到我的頻道逛逛https://www.youtube.com/@ipasstudybuddy
iPAS AI 自學路的其他內容
2025/11/01
我們現在要深入探討機器學習與大數據分析的基礎——「敘述性統計與資料摘要技術 (L22101)」中的核心指標:離散程度測量! 當我們在看一組資料時,光知道「平均數」是遠遠不夠的!平均數告訴你資料的中心在哪裡,但卻沒有告訴你資料有多「乖」或有多「亂」。 想像一下,兩組學生的平均分數都是 80 分。第
2025/11/01
我們現在要深入探討機器學習與大數據分析的基礎——「敘述性統計與資料摘要技術 (L22101)」中的核心指標:離散程度測量! 當我們在看一組資料時,光知道「平均數」是遠遠不夠的!平均數告訴你資料的中心在哪裡,但卻沒有告訴你資料有多「乖」或有多「亂」。 想像一下,兩組學生的平均分數都是 80 分。第
2025/10/31
統計學從來都不是為了「計算而計算」,它的價值在於幫助我們在不確定性中做出可衡量的判斷。當數據規模巨大時,我們不是拋棄統計,而是要調整戰略,讓它更好地服務於業務場景! 核心觀點:從「嚴謹推論」轉向「實務效益權衡」 在大數據環境下,資料量大、更新快速、來源複雜,這使得傳統統計推論所依賴的假設(如隨
2025/10/31
統計學從來都不是為了「計算而計算」,它的價值在於幫助我們在不確定性中做出可衡量的判斷。當數據規模巨大時,我們不是拋棄統計,而是要調整戰略,讓它更好地服務於業務場景! 核心觀點:從「嚴謹推論」轉向「實務效益權衡」 在大數據環境下,資料量大、更新快速、來源複雜,這使得傳統統計推論所依賴的假設(如隨
2025/10/31
學員們,大家好!很高興我們能繼續深入探討「集中趨勢測量」這個主題。在前面我們討論了最基礎的平均數、中位數和眾數,但身為一位專業的 AI 應用規劃師,你必須知道在特定場景下,這些常規指標會「失真」!
2025/10/31
學員們,大家好!很高興我們能繼續深入探討「集中趨勢測量」這個主題。在前面我們討論了最基礎的平均數、中位數和眾數,但身為一位專業的 AI 應用規劃師,你必須知道在特定場景下,這些常規指標會「失真」!
看更多
你可能也想看
Thumbnail
看到這篇文章的朋友有夠好運🍀🍀🍀 Kuma要來分享之前入手的好物🎁 以及輕鬆讓自己平時可以加薪的好方法👍 🎞️創作者必備這神助攻好物 身為Youtuber影音創作者(如果還不認識我的朋友😆歡迎去訂閱我的YT:熊星人Kuma), 影片素材檔案多到爆炸是日常💥 以前出門旅拍,
Thumbnail
看到這篇文章的朋友有夠好運🍀🍀🍀 Kuma要來分享之前入手的好物🎁 以及輕鬆讓自己平時可以加薪的好方法👍 🎞️創作者必備這神助攻好物 身為Youtuber影音創作者(如果還不認識我的朋友😆歡迎去訂閱我的YT:熊星人Kuma), 影片素材檔案多到爆炸是日常💥 以前出門旅拍,
Thumbnail
瞭解社會的慣習與不同的生長環境對個人發展的影響,並且如何運用知識、物質、社會、文化、身體、語言溝通、心理七種資本逆轉階層。
Thumbnail
瞭解社會的慣習與不同的生長環境對個人發展的影響,並且如何運用知識、物質、社會、文化、身體、語言溝通、心理七種資本逆轉階層。
Thumbnail
這是一個關於未來社會趨勢的文章,探討了未來社會的物質和精神生活,以及社會結構和人性的轉變。
Thumbnail
這是一個關於未來社會趨勢的文章,探討了未來社會的物質和精神生活,以及社會結構和人性的轉變。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
社會設計的背後時常帶有對於特定議題的關懷、渴望的改變,究竟「設計」能夠介入社區或城市創造哪些改變?
Thumbnail
社會設計的背後時常帶有對於特定議題的關懷、渴望的改變,究竟「設計」能夠介入社區或城市創造哪些改變?
Thumbnail
我們活在一個「數據為王」的時代,無形的壓力讓我們陷入一種「我是不是錯過了什麼?」的焦慮漩渦。文章提到當我們過度追求這些數字時,可能會迷失自己。愛因斯坦的名言提醒我們:「並不是所有重要的東西都能被計算,也不是所有能被計算的東西都重要。」
Thumbnail
我們活在一個「數據為王」的時代,無形的壓力讓我們陷入一種「我是不是錯過了什麼?」的焦慮漩渦。文章提到當我們過度追求這些數字時,可能會迷失自己。愛因斯坦的名言提醒我們:「並不是所有重要的東西都能被計算,也不是所有能被計算的東西都重要。」
Thumbnail
先說俺沒有任何相關專業知識,單純是自己的想像力而已。我知道,在這領域我只是一個無知的小角色。 這是某天半夜在準備休眠睡覺,閉著眼睛休息的過程中突然在腦袋裡跳出的問題。我不是高知識份子,也不怎麼看書,只是突然很好奇這個問題「當貨幣數量不變,人口卻一直增加時地球會變得怎麼樣?」 老實說我原本的畫
Thumbnail
先說俺沒有任何相關專業知識,單純是自己的想像力而已。我知道,在這領域我只是一個無知的小角色。 這是某天半夜在準備休眠睡覺,閉著眼睛休息的過程中突然在腦袋裡跳出的問題。我不是高知識份子,也不怎麼看書,只是突然很好奇這個問題「當貨幣數量不變,人口卻一直增加時地球會變得怎麼樣?」 老實說我原本的畫
Thumbnail
「世上本來就沒有單一普世的絕對標準,反而有著一堆是非對錯的爭論,甚至到最終都沒有標準答案;但在這些思辨與實踐的過程中,更多元的空間也因此被打開,更多的人就可能因此受惠。每個人都有自己的心智模式,為我們做出資訊的決定、行動,沒有絕對的好跟壞,都是依據個人經驗與狀況長出..... 」我們的社會是個集體意
Thumbnail
「世上本來就沒有單一普世的絕對標準,反而有著一堆是非對錯的爭論,甚至到最終都沒有標準答案;但在這些思辨與實踐的過程中,更多元的空間也因此被打開,更多的人就可能因此受惠。每個人都有自己的心智模式,為我們做出資訊的決定、行動,沒有絕對的好跟壞,都是依據個人經驗與狀況長出..... 」我們的社會是個集體意
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News