26/100 支援向量回歸（SVR） 🔥 適合複雜數據，透過超平面找到最佳預測點！

Hansen W

發佈於AI科技機器學習修煉坊

2025/05/27 更新2025/05/27 發佈閱讀 12 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

26/100 第三週：監督學習（回歸）

26. 支援向量回歸（SVR） 🔥 適合複雜數據，透過超平面找到最佳預測點！

🔥 支援向量回歸（SVR）

適合複雜數據，透過超平面找到最佳預測點！

________________________________________

📌 1️⃣ 什麼是支援向量回歸（SVR）？

支援向量回歸（Support Vector Regression, SVR）是支援向量機（SVM）在回歸問題中的應用。

它的核心概念是：

• 不像線性回歸只最小化誤差，而是尋找「最大間隔」的最佳超平面

• 允許一小部分數據點位於「誤差範圍（ε tube）」外

• 適合複雜、非線性數據，能找到更平滑的擬合曲線

________________________________________

📌 2️⃣ 支援向量回歸（SVR） vs. 傳統回歸

線性回歸與支援向量回歸（SVR）都是回歸分析的方法，但核心目標與適用場景有所不同。線性回歸著重於最小化整體的均方誤差（MSE），所有數據點的偏差都會影響模型，因此適合用於數據具有明顯線性關係的情境。相較之下，SVR 更關注在誤差容忍範圍「ε tube」之外的數據點，目的是找到一條在容忍範圍內最平滑的超平面，忽略範圍內的微小誤差，特別適合處理非線性或複雜結構的數據。簡而言之，線性回歸追求整體誤差最小化，SVR 則更強調對異常點和邊界的精確控制，適用於更具挑戰性的資料型態。

✅ SVR 特別適合非線性回歸問題！

________________________________________

📌 3️⃣ SVR 的核心概念

🎯 目標

• 找到一條「間隔最大」的超平面，使誤差在 ±ε 內的數據點不影響模型

• 只有「超過誤差範圍（ε tube）」的數據點才會影響模型

• 這讓 SVR 對異常值更有彈性，避免過擬合

📊 數學公式

SVR 的核心目標是：

找到一個函數 f(x)=w^Tx+b，使預測值距離實際值在「ε 容忍範圍」內，並且讓模型儘可能平滑。

比喻：

SVR 目標就像是——「開車過山路時，在允許的偏移範圍內盡量平穩前進，超出範圍就付出代價，但整體要保持路線平滑，避免激烈操作。」

________________________________________

📌 4️⃣ SVR 的三種核心內核（Kernels）

1. 線性內核（Linear Kernel） → 適合數據呈線性分佈

2. 多項式內核（Polynomial Kernel） → 適合稍微非線性的數據

3. RBF（徑向基函數內核） → 適合高度非線性數據，最常用

✅ RBF 是最常用的內核，因為它能夠適應大多數數據類型！

________________________________________

📌 5️⃣ Python 實作：SVR

🎯 目標：預測房價（非線性數據）

我們比較：

1. 線性回歸（Linear Regression）

2. SVR（RBF 內核）

________________________________________

✅ (1) 產生非線性數據

python

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.svm import SVR

from sklearn.linear_model import LinearRegression

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

from sklearn.metrics import mean_squared_error, r2_score

# 產生非線性數據（房屋面積 vs. 房價）

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 3000 * np.sqrt(X) + np.random.randint(-50000, 50000, size=(50, 1)) # 非線性房價

# 繪製數據

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("房價 vs. 房屋面積（非線性數據）")

plt.legend()

plt.show()

📌 房價與房屋面積的關係呈現非線性曲線，線性回歸可能不適用！

________________________________________

✅ (2) 訓練線性回歸 vs. SVR

python

# 分割數據

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 🔹 線性回歸

lin_reg = LinearRegression()

lin_reg.fit(X_train, y_train)

# 🔹 標準化數據（SVR 需要標準化）

scaler_X = StandardScaler()

scaler_y = StandardScaler()

X_train_scaled = scaler_X.fit_transform(X_train)

X_test_scaled = scaler_X.transform(X_test)

y_train_scaled = scaler_y.fit_transform(y_train)

# 🔹 訓練 SVR（RBF 內核）

svr_reg = SVR(kernel='rbf', C=100, epsilon=100)

svr_reg.fit(X_train_scaled, y_train_scaled.ravel())

📌 為什麼 SVR 需要標準化？

• SVR 對數據範圍敏感，如果不標準化，可能會影響結果

________________________________________

✅ (3) 預測與評估

python

# 預測

y_pred_lin = lin_reg.predict(X_test)

y_pred_svr = scaler_y.inverse_transform(svr_reg.predict(X_test_scaled).reshape(-1, 1)) # 反標準化

# 計算 MSE 和 R²

mse_lin = mean_squared_error(y_test, y_pred_lin)

r2_lin = r2_score(y_test, y_pred_lin)

mse_svr = mean_squared_error(y_test, y_pred_svr)

r2_svr = r2_score(y_test, y_pred_svr)

print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"SVR - MSE: {mse_svr:.2f}, R²: {r2_svr:.4f}")

📌 結果示例：

線性回歸 - MSE: 3.5e+10, R²: 0.55

SVR - MSE: 1.2e+9, R²: 0.92

📌 解讀

• SVR MSE 明顯更低（誤差小）

• R² 接近 1，代表 SVR 擬合效果更佳！

________________________________________

✅ (4) 視覺化 SVR 的預測曲線

python

# 產生更細的測試點來畫曲線

X_grid = np.linspace(min(X), max(X), 100).reshape(-1, 1)

X_grid_scaled = scaler_X.transform(X_grid)

y_pred_svr_curve = scaler_y.inverse_transform(svr_reg.predict(X_grid_scaled).reshape(-1, 1))

# 繪製結果

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, lin_reg.predict(X), color='red', linewidth=2, label="線性回歸")

plt.plot(X_grid, y_pred_svr_curve, color='green', linewidth=2, label="SVR 擬合曲線")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("SVR vs. 線性回歸")

plt.legend()

plt.show()

📌 結果：

• 線性回歸（紅色）：擬合效果不佳

• SVR（綠色）：擬合曲線更符合數據

________________________________________

📌 6️⃣ SVR 的優缺點

✅ 優點

• 適合非線性數據

• 對異常值不敏感

• 可用不同內核（RBF, Polynomial）擬合不同數據

⚠ 缺點

• 計算成本較高（O(n²)）

• 需要標準化數據

• 參數（C, ε, kernel）需要調整

________________________________________

🎯 總結

✅ SVR 對非線性數據效果比線性回歸好！

✅ RBF 內核最常用，能適應大多數情境

✅ 適合複雜數據，但計算成本較高

🚀 下一步：探索「隨機森林回歸」來提升預測能力！🌲🔥

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

13會員

274內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/27

25/100 決策樹回歸 🌳 像問問題一樣，透過條件分割找出最佳結果！

決策樹回歸像玩二十問答，逐層條件分割資料區間，以均值擬合非線性趨勢；免除繁瑣特徵工程也能大幅降低預測誤差，且保留直觀可解釋性。透過調整樹深即可抑制過擬合，是快速上手的靈活回歸利器，在房價估值、銷售預測等場景尤其實用。

2025/05/27

25/100 決策樹回歸 🌳 像問問題一樣，透過條件分割找出最佳結果！

2025/05/27

24/100 多項式回歸 🏛 當線性回歸不夠用時，讓 AI 用曲線來擬合資料！

多項式回歸，透過加入二次、三次等高次項，把直線變曲線，輕鬆捕捉房價、疾病進展等常見非線性趨勢。若你的散點圖呈彎曲，資料量又不大，使用 degree 2-3 的多項式回歸即可大幅降低 MSE、提升 R²，同時避免深度模型的高成本與複雜度。快速、易實作、效果顯著，是入門者解決非線性問題的首選利器！

2025/05/27

24/100 多項式回歸 🏛 當線性回歸不夠用時，讓 AI 用曲線來擬合資料！

2025/05/27

23/100 正則化回歸（Lasso, Ridge, ElasticNet） 🎛 防止模型過擬合，讓預測能力更穩定！

正則化回歸在損失函數中加入懲罰項，抑制權重過大，避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數；Lasso (L1) 可將部分係數壓成 0，兼具特徵選擇；ElasticNet 結合 L1 與 L2，兼顧去除冗餘與穩定性，特別適合高維且具共線性的資料。

2025/05/27

23/100 正則化回歸（Lasso, Ridge, ElasticNet） 🎛 防止模型過擬合，讓預測能力更穩定！

看更多

你可能也想看

廣告雜誌

渴望創造了AI，也搖滾了這世界

時間快轉至2030年，或許城市還無懸浮飛車，但AI先會像電力存在每一個角落。百工百業運用智慧算力，就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景，正逐漸在世界各地悄然成形。

#台北國際數位廣告節#TIDAF#廣告雜誌

2024/08/01

廣告雜誌

渴望創造了AI，也搖滾了這世界

#台北國際數位廣告節#TIDAF#廣告雜誌

2024/08/01

曹滴掉~ 寬廣vs渺小的沙龍

閱讀書評：《AI世界的底層邏輯與生存法則》

作者認為AI，它不特屬於哪一個產業，在一定時間成熟之後，它充斥你我生活之中，就是像水電一樣的自然。有很多人還搞不清楚它的未來發展到哪裡？當這變化還很劇烈時，過早投入反而浪費時間與成本，所以作者的洞見是：什麼是你我最珍貴的價值？

#AI#人工智慧#產業發展

2024/06/14

曹滴掉~ 寬廣vs渺小的沙龍

閱讀書評：《AI世界的底層邏輯與生存法則》

#AI#人工智慧#產業發展

2024/06/14

廣告雜誌

黃仁勳風暴(一)：生成式AI強大潛能！AWS與NVIDIA Project Ceiba超級AI運算平台加速創新

在科技發展的浪潮中，生成式AI無疑是引領未來的關鍵力量。透過深度學習技術，AI系統能夠從大量資料中發掘規律，並創造出全新的內容，無論是文字、圖像、音頻還是視頻，都可以在AI的加持下重新定義。

#黃仁勳#AWS#NVIDIA

2024/06/06

廣告雜誌

黃仁勳風暴(一)：生成式AI強大潛能！AWS與NVIDIA Project Ceiba超級AI運算平台加速創新

2024/06/06

AI PC 法人這樣看

2024/05/24

AI PC 法人這樣看

2024/05/24

筆記-股癌-24.05.22 *認養狗可以聯絡Liza的IG。 *微軟AI PC: - 售價1000歐元起的AI PC，6/18推出，晶片NPU算力在40 TOPS以上， - 裝置有連動GPT-4o，這部分的功能還是要連上網；Copilot功能下放到邊緣端。 - recall功能，可以把螢

2024/05/23

每日發車

筆記-股癌-24.05.22

2024/05/23

螃蟹_crab的沙龍

[機器學習]感知器(Perceptron)學習心得

感知器是一種基本的神經網路模型，用於二分類問題。它模擬了人腦神經元的工作原理，通過調整權重和偏差值來達到預測和分類的目的。感知器流程輸入資料的輸入: 輸入層接受資料的輸入，每個輸入對應一個特徵，還有一個固定的偏差神經元。資料經過每個神經元時，會乘上相應的

#Perceptron#Python#機器學習

2024/05/18

螃蟹_crab的沙龍

[機器學習]感知器(Perceptron)學習心得

#Perceptron#Python#機器學習

2024/05/18

D&Y熊繪生的沙龍

不用靠電腦！用ESP32 x ArduinoIDE學AI機器學習｜[手勢辨識]

這篇文章介紹瞭如何利用單晶片來控制不同功能模組的應用，並分享了親手體驗的影片和遇到的卡關。文章強調了需要具備基礎程式語言撰寫的邏輯，以及解決卡關時需要個人調整程式碼的順序。

#程式#教材#科學

2024/05/08

D&Y熊繪生的沙龍

不用靠電腦！用ESP32 x ArduinoIDE學AI機器學習｜[手勢辨識]

#程式#教材#科學

2024/05/08

易樂的沙龍

AI時代: 無損編碼自由轉換和軟體定義硬件

本文章探討了多智能體系統（MAS）在生成式AI領域中的應用，以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響，並提供了有關GenAI的一些額外信息。

#人工智能#SSD#模型

2024/04/21

易樂的沙龍

AI時代: 無損編碼自由轉換和軟體定義硬件

#人工智能#SSD#模型

2024/04/21

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News