簡單來說，特徵必須統一尺度，是因為所有依賴「距離」或「梯度」的機器學習模型，都要求所有輸入特徵在數學上具有公平的「發言權」；如果不縮放，數值最大的特徵就會在模型訓練中造成數據「霸凌」與訓練「震盪」！

特徵尺度的統一：為什麼是模型的「生存法則」？

2025/11/03 更新2025/11/03 發佈閱讀 5 分鐘

在現實世界的資料中，「年齡」可能以 10 到 100 為單位，「年收入」卻以 50 萬到 1000 萬為單位。如果直接將這兩組數值輸入模型，數值範圍巨大的特徵將會在數學上完全主導模型的判斷，使得數值範圍小的特徵形同虛設，這就是我們常說的「尺度霸凌」現象。

特徵縮放（Feature Scaling），無論是正規化（Normalization） 將數值轉換至區間，或是標準化（Standardization） 將數值轉換為 μ=0,σ=1 的分佈，目的都是在統一量級，確保所有特徵維度對模型的貢獻是公平且穩定的。

這種統一之所以關鍵，是因為它解決了三類核心模型學習機制上的偏差：

1. 核心機制：距離計算的扭曲 (Distance Distortion)

許多機器學習模型在決策時，高度依賴於樣本點之間的 幾何距離 來判斷相似性或劃分邊界。如果特徵尺度差異過大，距離計算將被高尺度的特徵所支配，進而導致判斷結果失真。

• 代表模型： K-最近鄰 (KNN) 與 支持向量機 (SVM)。

• 底層邏輯：

◦ KNN 透過計算新樣本與所有訓練樣本的距離（例如歐幾里得距離），來找到最接近的 K 個鄰居，並進行分類或迴歸。當某一特徵的數值範圍比其他特徵大數百倍時，距離的計算將幾乎完全由該高尺度特徵決定，低尺度的特徵將失去判斷相似性的能力。因此，KNN 對特徵尺度是高度敏感的，必須進行特徵縮放。

◦ SVM 的目標是找到最大化類別間隔（Margin）的超平面。這個超平面的位置和間隔的計算，同樣對特徵的量級敏感。標準化處理能夠幫助 SVM 更好地找到這個最大間隔，並提升其在高維空間中的表現和訓練效率。

2. 核心機制：梯度下降的不穩 (Gradient Instability)

許多模型，尤其是採用迭代優化方法（如梯度下降）來更新模型參數（權重）時，特徵的尺度會直接影響優化過程的效率與穩定性。

• 代表模型： 線性迴歸 (Linear Regression)、邏輯迴歸 (Logistic Regression) 以及所有的 深度神經網路 (Deep Neural Networks)。

• 底層邏輯：

◦ 梯度下降依賴計算損失函數對每個參數的偏導數（即梯度）來調整權重。如果一個特徵的數值範圍很大，它對損失函數的貢獻（梯度）也會更大。

◦ 在優化過程中，這會導致模型在對應高尺度特徵的維度上，權重更新的步伐過大，產生劇烈震盪或發散；而在低尺度特徵的維度上，權重更新卻緩慢無力，難以收斂至最佳解。

◦對於這類模型，特徵縮放（特別是標準化至 μ=0,σ=1）是不可或缺的前處理步驟。在深度學習中，類似的機制如層歸一化（Layer Normalization） 也是為了穩定訓練過程中的數據分佈，避免內部協變偏移，提升收斂速度。

3. 核心機制：權重懲罰的偏差 (Regularization Bias)

在加入正則化項（Regularization Term）以防止模型過度擬合（Overfitting）時，特徵尺度會破壞懲罰機制的公平性。

• 代表模型： Lasso 迴歸 (L1 正則化) 與 Ridge 迴歸 (L2 正則化)。

• 底層邏輯：

◦ 正則化項通過懲罰模型權重（係數 β）的大小來限制模型的複雜度。例如，L2 正則化會最小化 ∑βj2。

◦ 如果特徵 XA 的數值很大，模型為了保持預測結果 Y 不變，會賦予 XA 一個非常小的權重 βA。反之，數值小的特徵 XB 會獲得一個相對大的權重 βB。

◦ 當我們對權重進行懲罰時，L2 懲罰項 ∑β2 會不成比例地壓縮權重較大的 βB（即對應低尺度特徵的權重），導致正則化的效果偏向懲罰低尺度的特徵，而非公正地懲罰所有權重。

◦ 為了讓正則化能夠基於特徵的實際重要性而非其數值大小進行懲罰，我們必須先將特徵縮放到同一尺度。

--------------------------------------------------------------------------------

簡單來說，特徵必須統一尺度，是因為所有依賴「距離」或「梯度」的機器學習模型，都要求所有輸入特徵在數學上具有公平的「發言權」；如果不縮放，數值最大的特徵就會在模型訓練中造成數據「霸凌」與訓練「震盪」！

iPAS AI 自學路iPAS AI應用規劃師中級

留言

留言分享你的想法！

iPAS AI 自學路

15會員

61內容數

我是一位正在追求職涯升級的 40 歲非本科系上班族。我會將自己摸索出的高效白話筆記與聽覺學習法無私分享，助你：克服術語障礙、利用零碎時間學習、系統化整理考點。也歡迎到我的頻道逛逛https://www.youtube.com/@ipasstudybuddy

iPAS AI 自學路的其他內容

2025/11/01

學會！用IQR秒抗極端值偷襲！(L22101)

我們現在要深入探討機器學習與大數據分析的基礎——「敘述性統計與資料摘要技術 (L22101)」中的核心指標：離散程度測量！當我們在看一組資料時，光知道「平均數」是遠遠不夠的！平均數告訴你資料的中心在哪裡，但卻沒有告訴你資料有多「乖」或有多「亂」。想像一下，兩組學生的平均分數都是 80 分。第

2025/11/01

學會！用IQR秒抗極端值偷襲！(L22101)

2025/10/31

掌握！用效果量取代P值的決策邏輯 (L22301)

統計學從來都不是為了「計算而計算」，它的價值在於幫助我們在不確定性中做出可衡量的判斷。當數據規模巨大時，我們不是拋棄統計，而是要調整戰略，讓它更好地服務於業務場景！核心觀點：從「嚴謹推論」轉向「實務效益權衡」在大數據環境下，資料量大、更新快速、來源複雜，這使得傳統統計推論所依賴的假設（如隨

2025/10/31

掌握！用效果量取代P值的決策邏輯 (L22301)

2025/10/31

為什麼計算速度，要用調和平均數？

學員們，大家好！很高興我們能繼續深入探討「集中趨勢測量」這個主題。在前面我們討論了最基礎的平均數、中位數和眾數，但身為一位專業的 AI 應用規劃師，你必須知道在特定場景下，這些常規指標會「失真」！

2025/10/31

你可能也想看

看到這篇文章的朋友有夠好運🍀🍀🍀 Kuma要來分享之前入手的好物🎁 以及輕鬆讓自己平時可以加薪的好方法👍 🎞️創作者必備這神助攻好物身為Youtuber影音創作者(如果還不認識我的朋友😆歡迎去訂閱我的YT:熊星人Kuma)，影片素材檔案多到爆炸是日常💥 以前出門旅拍，

2025/11/05

2025/11/05

慣習的7種資本，瞭解不同資本的影響可以改變階級定位

瞭解社會的慣習與不同的生長環境對個人發展的影響，並且如何運用知識、物質、社會、文化、身體、語言溝通、心理七種資本逆轉階層。

#身體#社交#心理

2024/07/28

唉咿工程師 LC

慣習的7種資本，瞭解不同資本的影響可以改變階級定位

瞭解社會的慣習與不同的生長環境對個人發展的影響，並且如何運用知識、物質、社會、文化、身體、語言溝通、心理七種資本逆轉階層。

#身體#社交#心理

2024/07/28

Fornik Tsai 的沙龍

事實・崩裂

這是一個關於未來社會趨勢的文章，探討了未來社會的物質和精神生活，以及社會結構和人性的轉變。

#戀愛腦#毛小孩#日本旅遊

2024/07/25

Fornik Tsai 的沙龍

事實・崩裂

這是一個關於未來社會趨勢的文章，探討了未來社會的物質和精神生活，以及社會結構和人性的轉變。

#戀愛腦#毛小孩#日本旅遊

2024/07/25

珥東圓子的方格子

追逐網路流量的人類病了

在流量為王的網路時代，有多少網路工作者被瀏覽數及追蹤數等數據所掌控？又有多少人會以網路流量為評斷依據，判斷究竟一個人說出口的話「有沒有價值」？在面對一項人事物時，不少人都容易簡單粗略地以「外在價值」來做評斷，但價值其實不僅僅存在於外在、可量化的，更多的是隱藏在內、難以量化的深度價值。

2024/07/13

2024/07/13

蕭氏人肉演算 ➔ 2024 Apr. 12

社會設計的背後時常帶有對於特定議題的關懷、渴望的改變，究竟「設計」能夠介入社區或城市創造哪些改變？

2024/07/01

蕭詒徽的沙龍

蕭氏人肉演算 ➔ 2024 Apr. 12

社會設計的背後時常帶有對於特定議題的關懷、渴望的改變，究竟「設計」能夠介入社區或城市創造哪些改變？

2024/07/01

所以，為什麼：不寫作？

被創造的績效，數字為王時代

我們活在一個「數據為王」的時代，無形的壓力讓我們陷入一種「我是不是錯過了什麼？」的焦慮漩渦。文章提到當我們過度追求這些數字時，可能會迷失自己。愛因斯坦的名言提醒我們：「並不是所有重要的東西都能被計算，也不是所有能被計算的東西都重要。」

2024/05/28

2024/05/28

隨心思考❤當貨幣數量不變人口卻一直增加時—地球會變得怎麼樣❤

先說俺沒有任何相關專業知識，單純是自己的想像力而已。我知道，在這領域我只是一個無知的小角色。這是某天半夜在準備休眠睡覺，閉著眼睛休息的過程中突然在腦袋裡跳出的問題。我不是高知識份子，也不怎麼看書，只是突然很好奇這個問題「當貨幣數量不變，人口卻一直增加時地球會變得怎麼樣？」老實說我原本的畫

#貨幣#富窮#地球

2024/05/23

⋆✴︎˚傻媽咪思考魔法世界☪︎𓅓

隨心思考❤當貨幣數量不變人口卻一直增加時—地球會變得怎麼樣❤

#貨幣#富窮#地球

2024/05/23

芳的沙龍

世界的標準

「世上本來就沒有單一普世的絕對標準，反而有著一堆是非對錯的爭論，甚至到最終都沒有標準答案；但在這些思辨與實踐的過程中，更多元的空間也因此被打開，更多的人就可能因此受惠。每個人都有自己的心智模式，為我們做出資訊的決定、行動，沒有絕對的好跟壞，都是依據個人經驗與狀況長出..... 」我們的社會是個集體意

2024/05/19

芳的沙龍

世界的標準

2024/05/19

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News