24/100 多項式回歸 🏛 當線性回歸不夠用時，讓 AI 用曲線來擬合資料！

Hansen W

發佈於AI科技機器學習修煉坊

更新於 2025/05/28發佈於 2025/05/27閱讀時間約 10 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

24/100 第三週：監督學習（回歸）

24. 多項式回歸 🏛 當線性回歸不夠用時，讓 AI 用曲線來擬合資料！

🏛 多項式回歸（Polynomial Regression）

當線性回歸不夠用時，讓 AI 用曲線來擬合資料！

________________________________________

📌 1️⃣ 為什麼需要多項式回歸？

線性回歸只能擬合直線，但現實數據通常是非線性的！

例如：

• 房價變化：隨著時間或市場需求，房價可能呈曲線增長 📈

• 疾病進展：某些疾病的惡化速度隨時間呈指數或拋物線型變化 🏥

• 車速與煞車距離：當車速增快時，煞車距離呈現二次曲線 🚗💨

這時候，我們可以使用多項式回歸（Polynomial Regression）來擬合非線性數據！

它其實是線性回歸的一種擴展，但它增加了高次項特徵，讓回歸線變成曲線。

________________________________________

📌 2️⃣ 多項式回歸的數學公式

多項式回歸方程（以二次為例）：

y=w1X+w2X平方+by

這樣，回歸線就變成了一條拋物線 📈！

當我們增加更高次項（n次方）時，模型可以擬合更複雜的非線性關係。

________________________________________

📌 3️⃣ Python 實作：多項式回歸

🎯 例子：房價隨著房屋面積的非線性變化

我們用線性回歸 vs. 多項式回歸來對比它們的擬合效果。

________________________________________

✅ (1) 產生數據

python

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.linear_model import LinearRegression

from sklearn.preprocessing import PolynomialFeatures

from sklearn.metrics import mean_squared_error, r2_score

# 產生非線性數據（房價 vs. 房屋面積）

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 3000 * X**2 - 5000 * X + 100000 + np.random.randint(-500000, 500000, size=(50, 1)) # 非線性房價

# 繪製散點圖

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

📌 房價 vs. 房屋面積的數據呈現「非線性曲線關係」。

________________________________________

✅ (2) 使用線性回歸擬合

python

# 創建線性回歸模型

lin_reg = LinearRegression()

lin_reg.fit(X, y)

# 預測

y_pred_lin = lin_reg.predict(X)

# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_lin, color='red', linewidth=2, label="線性回歸擬合")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("線性回歸擬合效果")

plt.legend()

plt.show()

📌 結果：線性回歸無法準確擬合數據，因為數據是非線性的！

________________________________________

✅ (3) 使用二次多項式回歸擬合

python

# 創建二次多項式特徵

poly = PolynomialFeatures(degree=2) # 2 次方

X_poly = poly.fit_transform(X)

# 創建並訓練模型

poly_reg = LinearRegression()

poly_reg.fit(X_poly, y)

# 預測

y_pred_poly = poly_reg.predict(X_poly)

# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_poly, color='green', linewidth=2, label="二次多項式回歸擬合")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("二次多項式回歸擬合效果")

plt.legend()

plt.show()

📌 結果：多項式回歸能準確擬合數據，擬合的曲線明顯更符合原始數據！

________________________________________

✅ (4) 模型評估

我們比較線性回歸 vs. 多項式回歸的均方誤差（MSE）和決定係數（R²）：

python

# 計算 MSE 和 R²

mse_lin = mean_squared_error(y, y_pred_lin)

r2_lin = r2_score(y, y_pred_lin)

mse_poly = mean_squared_error(y, y_pred_poly)

r2_poly = r2_score(y, y_pred_poly)

print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"二次多項式回歸 - MSE: {mse_poly:.2f}, R²: {r2_poly:.4f}")

📌 結果示例：

線性回歸 - MSE: 3.2e+10, R²: 0.45

二次多項式回歸 - MSE: 1.5e+9, R²: 0.92

📌 解讀：

• MSE（均方誤差）越小越好 → 多項式回歸誤差比線性回歸小很多

• R²（決定係數）越接近 1 越好 → 多項式回歸的 R² 遠高於線性回歸

________________________________________

📌 4️⃣ 何時使用多項式回歸？

多項式回歸適用於數據呈現非線性關係的情境，當散點圖中的數據點顯示出彎曲的趨勢時，利用多項式回歸可以更精準地擬合這種曲線型態。此外，當數據量較小、無法有效運用成本較高的深度學習技術時，多項式回歸是一種簡單又強大的替代方案，能有效捕捉數據中的複雜關係。同時，多項式回歸透過特徵轉換，將原始特徵擴展到更高維度，使模型能學習到更多樣的模式與變化，進一步提升預測能力。

________________________________________

📌 5️⃣ 選擇適當的多項式次數（Degree）

如果次數太高（如 10 次），模型可能會過擬合（Overfitting），學習到噪音而非真正的模式。

📌 建議

• Degree = 2~3：通常可以解決大多數非線性問題

• Degree > 5：可能會過擬合，需要謹慎使用

• 使用交叉驗證（Cross-Validation）找到最佳次數

________________________________________

🎯 結論

✅ 線性回歸無法擬合非線性數據，多項式回歸能解決這個問題！

✅ 二次或三次多項式回歸通常足夠，不建議使用過高次數！

✅ 多項式回歸適合小型數據集，在大數據上可能不如神經網絡有效！

🚀 下一步：探索「決策樹回歸」來處理更複雜的數據！ 🌲

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

3會員

106內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/27

23/100 正則化回歸（Lasso, Ridge, ElasticNet） 🎛 防止模型過擬合，讓預測能力更穩定！

正則化回歸在損失函數中加入懲罰項，抑制權重過大，避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數；Lasso (L1) 可將部分係數壓成 0，兼具特徵選擇；ElasticNet 結合 L1 與 L2，兼顧去除冗餘與穩定性，特別適合高維且具共線性的資料。

2025/05/27

23/100 正則化回歸（Lasso, Ridge, ElasticNet） 🎛 防止模型過擬合，讓預測能力更穩定！

2025/05/27

22/100 多元線性回歸 📊 考慮多個變數影響，讓預測結果更精準！

多元線性回歸單元，教你一次掌握多維特徵建模、共線性診斷與 Python 實戰，讓房價、銷售額等預測更精準，打下進階回歸與正則化基礎。透過真實數據實驗，從特徵選擇、模型訓練到評估指標，一站式建立多變量思維，快速提升商業分析與決策能力。

2025/05/27

22/100 多元線性回歸 📊 考慮多個變數影響，讓預測結果更精準！

2025/05/27

21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

想快速掌握機器學習核心？本單元以房價案例手把手示範線性回歸，從理論、Python 實作到評估指標，一條直線即可洞悉數據趨勢，建立建模信心，是所有 AI 新人不可錯過的啟蒙課！更結合 MSE、R² 等評估技巧，助你打下回歸分析扎實基礎，邁向進階多元模型。

2025/05/27

21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

看更多

你可能也想看

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

全球科技產業的焦點，AKA 全村的希望 NVIDIA，於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1，實際日曆期間為今年二到四月)，交出了打敗了市場預期的成績單。然而，在銷售持續高速成長的同時，川普政府加大對於中國的晶片管制......

#NVDA#NVIDIA#輝達

2025/06/18

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

#NVDA#NVIDIA#輝達

2025/06/18

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19