24/100 多項式回歸 🏛 當線性回歸不夠用時,讓 AI 用曲線來擬合資料!

更新於 發佈於 閱讀時間約 10 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


24/100 第三週:監督學習(回歸)


24. 多項式回歸 🏛 當線性回歸不夠用時,讓 AI 用曲線來擬合資料!


🏛 多項式回歸(Polynomial Regression)

當線性回歸不夠用時,讓 AI 用曲線來擬合資料!

________________________________________


📌 1️⃣ 為什麼需要多項式回歸?


線性回歸只能擬合直線,但現實數據通常是非線性的!

例如:


房價變化:隨著時間或市場需求,房價可能呈曲線增長 📈

疾病進展:某些疾病的惡化速度隨時間呈指數或拋物線型變化 🏥

車速與煞車距離:當車速增快時,煞車距離呈現二次曲線 🚗💨


這時候,我們可以使用 多項式回歸(Polynomial Regression) 來擬合 非線性數據!


它其實是 線性回歸的一種擴展,但它增加了 高次項特徵,讓回歸線變成曲線。

________________________________________


📌 2️⃣ 多項式回歸的數學公式


多項式回歸方程(以二次為例):


y=w1X+w2X平方+by


這樣,回歸線就變成了一條 拋物線 📈!


當我們增加 更高次項(n次方) 時,模型可以擬合更複雜的非線性關係。


________________________________________


📌 3️⃣ Python 實作:多項式回歸


🎯 例子:房價隨著房屋面積的非線性變化


我們用 線性回歸 vs. 多項式回歸 來對比它們的擬合效果。

________________________________________

✅ (1) 產生數據

python


import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.linear_model import LinearRegression

from sklearn.preprocessing import PolynomialFeatures

from sklearn.metrics import mean_squared_error, r2_score


# 產生非線性數據(房價 vs. 房屋面積)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 3000 * X**2 - 5000 * X + 100000 + np.random.randint(-500000, 500000, size=(50, 1)) # 非線性房價


# 繪製散點圖

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()


📌 房價 vs. 房屋面積的數據呈現「非線性曲線關係」。

________________________________________

✅ (2) 使用線性回歸擬合

python


# 創建線性回歸模型

lin_reg = LinearRegression()

lin_reg.fit(X, y)


# 預測

y_pred_lin = lin_reg.predict(X)


# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_lin, color='red', linewidth=2, label="線性回歸擬合")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("線性回歸擬合效果")

plt.legend()

plt.show()

📌 結果: 線性回歸無法準確擬合數據,因為數據是非線性的!

________________________________________


✅ (3) 使用二次多項式回歸擬合


python


# 創建二次多項式特徵

poly = PolynomialFeatures(degree=2) # 2 次方

X_poly = poly.fit_transform(X)


# 創建並訓練模型

poly_reg = LinearRegression()

poly_reg.fit(X_poly, y)


# 預測

y_pred_poly = poly_reg.predict(X_poly)


# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_poly, color='green', linewidth=2, label="二次多項式回歸擬合")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("二次多項式回歸擬合效果")

plt.legend()

plt.show()


📌 結果: 多項式回歸能準確擬合數據,擬合的曲線明顯更符合原始數據!

________________________________________


✅ (4) 模型評估


我們比較 線性回歸 vs. 多項式回歸 的 均方誤差(MSE) 和 決定係數(R²):


python


# 計算 MSE 和 R²

mse_lin = mean_squared_error(y, y_pred_lin)

r2_lin = r2_score(y, y_pred_lin)


mse_poly = mean_squared_error(y, y_pred_poly)

r2_poly = r2_score(y, y_pred_poly)


print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"二次多項式回歸 - MSE: {mse_poly:.2f}, R²: {r2_poly:.4f}")


📌 結果示例:


線性回歸 - MSE: 3.2e+10, R²: 0.45

二次多項式回歸 - MSE: 1.5e+9, R²: 0.92


📌 解讀:


MSE(均方誤差)越小越好 → 多項式回歸誤差比線性回歸小很多

R²(決定係數)越接近 1 越好 → 多項式回歸的 R² 遠高於線性回歸

________________________________________


📌 4️⃣ 何時使用多項式回歸?


多項式回歸適用於數據呈現非線性關係的情境,當散點圖中的數據點顯示出彎曲的趨勢時,利用多項式回歸可以更精準地擬合這種曲線型態。此外,當數據量較小、無法有效運用成本較高的深度學習技術時,多項式回歸是一種簡單又強大的替代方案,能有效捕捉數據中的複雜關係。同時,多項式回歸透過特徵轉換,將原始特徵擴展到更高維度,使模型能學習到更多樣的模式與變化,進一步提升預測能力。

________________________________________


📌 5️⃣ 選擇適當的多項式次數(Degree)


如果次數太高(如 10 次),模型可能會過擬合(Overfitting),學習到噪音而非真正的模式。


📌 建議


Degree = 2~3:通常可以解決大多數非線性問題

Degree > 5:可能會過擬合,需要謹慎使用

使用交叉驗證(Cross-Validation) 找到最佳次數

________________________________________


🎯 結論


✅ 線性回歸無法擬合非線性數據,多項式回歸能解決這個問題!

✅ 二次或三次多項式回歸通常足夠,不建議使用過高次數!

✅ 多項式回歸適合小型數據集,在大數據上可能不如神經網絡有效!


🚀 下一步:探索「決策樹回歸」來處理更複雜的數據! 🌲


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
3會員
106內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/27
正則化回歸在損失函數中加入懲罰項,抑制權重過大,避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數;Lasso (L1) 可將部分係數壓成 0,兼具特徵選擇;ElasticNet 結合 L1 與 L2,兼顧去除冗餘與穩定性,特別適合高維且具共線性的資料。
Thumbnail
2025/05/27
正則化回歸在損失函數中加入懲罰項,抑制權重過大,避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數;Lasso (L1) 可將部分係數壓成 0,兼具特徵選擇;ElasticNet 結合 L1 與 L2,兼顧去除冗餘與穩定性,特別適合高維且具共線性的資料。
Thumbnail
2025/05/27
多元線性回歸單元,教你一次掌握多維特徵建模、共線性診斷與 Python 實戰,讓房價、銷售額等預測更精準,打下進階回歸與正則化基礎。透過真實數據實驗,從特徵選擇、模型訓練到評估指標,一站式建立多變量思維,快速提升商業分析與決策能力。
Thumbnail
2025/05/27
多元線性回歸單元,教你一次掌握多維特徵建模、共線性診斷與 Python 實戰,讓房價、銷售額等預測更精準,打下進階回歸與正則化基礎。透過真實數據實驗,從特徵選擇、模型訓練到評估指標,一站式建立多變量思維,快速提升商業分析與決策能力。
Thumbnail
2025/05/27
想快速掌握機器學習核心?本單元以房價案例手把手示範線性回歸,從理論、Python 實作到評估指標,一條直線即可洞悉數據趨勢,建立建模信心,是所有 AI 新人不可錯過的啟蒙課!更結合 MSE、R² 等評估技巧,助你打下回歸分析扎實基礎,邁向進階多元模型。
Thumbnail
2025/05/27
想快速掌握機器學習核心?本單元以房價案例手把手示範線性回歸,從理論、Python 實作到評估指標,一條直線即可洞悉數據趨勢,建立建模信心,是所有 AI 新人不可錯過的啟蒙課!更結合 MSE、R² 等評估技巧,助你打下回歸分析扎實基礎,邁向進階多元模型。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
本文將探討人工智能對生活上的影響和改變,同時,例如規劃時間,安排選擇等等,附上一些建議與推薦工具。 在今天,大語言模型開通全球,我們可以輕易的使用人工智能對話,和他們對話,交流,討論,但是,除了娛樂以外,在生活上,我們還有什麼用法呢?
Thumbnail
本文將探討人工智能對生活上的影響和改變,同時,例如規劃時間,安排選擇等等,附上一些建議與推薦工具。 在今天,大語言模型開通全球,我們可以輕易的使用人工智能對話,和他們對話,交流,討論,但是,除了娛樂以外,在生活上,我們還有什麼用法呢?
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News