22/100 多元線性回歸 📊 考慮多個變數影響，讓預測結果更精準！

Hansen W

發佈於AI科技機器學習修煉坊

更新於 2025/05/27發佈於 2025/05/27閱讀時間約 9 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

22/100 第三週：監督學習（回歸）

22. 多元線性回歸 📊 考慮多個變數影響，讓預測結果更精準！

📊 多元線性回歸（Multiple Linear Regression）

考慮多個變數影響，讓預測結果更精準！

在實際應用中，影響結果的因素往往不只一個。例如：

• 房價預測 🏠：受面積、房齡、樓層數影響

• 銷售額預測 💰：受廣告費、產品價格、季節影響

• 健康狀況預測 ❤️：受飲食習慣、運動量、睡眠時長影響

這時候，單純的線性回歸不夠精確，我們需要多元線性回歸！

________________________________________

1️⃣ 什麼是多元線性回歸？

多元線性回歸（Multiple Linear Regression）是線性回歸的擴展版，考慮多個特徵變數 X1,X2,...,Xn 來預測目標變數 y。

📌 方程式

y=w1X1+w2X2+...+wnXn+by

其中：

• y = 目標值（預測值）

• X1,X2,...,Xn = 輸入變數（特徵）

• w1,w2,...,wn = 權重（每個變數的影響力）

• b = 截距（bias）

🎯 目標

透過最小二乘法（Least Squares Method），找到最佳的 w 和 b，讓誤差最小化，使預測結果更準確。

________________________________________

2️⃣ 多元線性回歸的 Python 實作

📌 例子：預測房價

假設房價受房屋面積、房齡、樓層數三個變數影響，我們使用多元線性回歸來建立模型。

________________________________________

✅ (1) 生成數據

python

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.model_selection import train_test_split

# 產生隨機數據（50 筆房屋數據）

np.random.seed(42)

X1 = np.random.randint(20, 200, size=50) # 房屋面積（平方公尺）

X2 = np.random.randint(1, 50, size=50) # 房齡（年）

X3 = np.random.randint(1, 10, size=50) # 樓層數

# 房價計算（模擬真實情況）

y = 5000 * X1 - 3000 * X2 + 2000 * X3 + 10000 + np.random.randint(-50000, 50000, size=50)

# 轉換為 DataFrame

df = pd.DataFrame({'面積': X1, '房齡': X2, '樓層': X3, '房價': y})

# 顯示前 5 筆數據

print(df.head())

📌 這些數據模擬真實世界的房價影響因素：

• 面積增加 → 房價上升

• 房齡增加 → 房價下降

• 樓層增加 → 房價略微上升

________________________________________

✅ (2) 訓練多元線性回歸模型

python

# 分割訓練集與測試集（80% 訓練，20% 測試）

X = df[['面積', '房齡', '樓層']] # 特徵變數

y = df['房價'] # 目標變數

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 創建並訓練模型

model = LinearRegression()

model.fit(X_train, y_train)

# 獲取最佳參數

w1, w2, w3 = model.coef_ # 權重

b = model.intercept_ # 截距

print(f"多元線性回歸方程：房價 = {w1:.2f} * 面積 + {w2:.2f} * 房齡 + {w3:.2f} * 樓層 + {b:.2f}")

📌 結果示例：

房價=4978.32×面積−3021.45×房齡+1987.30×樓層+10342.67

解讀

• 每增加 1 平方公尺，房價增加 4978.32 元

• 每增加 1 年房齡，房價減少 3021.45 元

• 每增加 1 層樓，房價增加 1987.30 元

________________________________________

✅ (3) 預測與評估模型

python

from sklearn.metrics import mean_squared_error, r2_score

# 預測測試集房價

y_pred = model.predict(X_test)

# 計算均方誤差（MSE）與 R²

mse = mean_squared_error(y_test, y_pred)

r2 = r2_score(y_test, y_pred)

print(f"MSE（均方誤差）：{mse:.2f}")

print(f"R² 決定係數：{r2:.4f}")

📌 R²（決定係數）

• 範圍：0 ~ 1

• 越接近 1，表示模型擬合效果越好

• 若 R² 很低，可能需要考慮非線性回歸

________________________________________

3️⃣ 多元線性回歸的優缺點

✅ 優點

• 考慮多個變數，提高預測準確度

• 結果具有可解釋性，每個變數的影響力明確

• 計算效率高，適合大數據應用

⚠ 缺點

• 假設變數之間沒有共線性（Multicollinearity）

o 例如：「房屋面積」和「房間數」可能高度相關，影響回歸效果

• 無法擬合非線性數據

o 例如：「房價 vs. 季節變化」，可能需要多項式回歸或決策樹回歸

• 容易受異常值（Outliers）影響

________________________________________

4️⃣ 如何處理變數之間的共線性？

📌 (1) 檢查特徵之間的相關性

python

import seaborn as sns

# 計算特徵之間的相關係數

correlation_matrix = df.corr()

# 繪製熱圖

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")

plt.title("特徵之間的相關性")

plt.show()

📌 若兩個變數高度相關（接近 1 或 -1），可能需要刪除其中一個！

📌 結論

✅ 多元線性回歸考慮多個變數，使預測更精準！

✅ 適合應用於房價預測、銷售額預測、健康分析等領域

✅ 但要注意變數之間的共線性，下一章節介紹使用 Ridge/Lasso

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

2會員

106內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/27

21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

想快速掌握機器學習核心？本單元以房價案例手把手示範線性回歸，從理論、Python 實作到評估指標，一條直線即可洞悉數據趨勢，建立建模信心，是所有 AI 新人不可錯過的啟蒙課！更結合 MSE、R² 等評估技巧，助你打下回歸分析扎實基礎，邁向進階多元模型。

2025/05/27

21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

掌握 Pandas、NumPy，一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維！模組化範例搭配自測題，快速鞏固概念並排除常見坑，助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀，快速開啟數據科學核心能力！

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

面對類別不平衡，別再只看準確率！本單元以詐欺檢測為例，手把手示範過／欠採樣、SMOTE 與 class_weight，並教你用 Recall、F1、AUC 全面評估，讓模型真正兼顧公平與效能。理論＋程式碼雙線並進，入門實戰必看！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

看更多

你可能也想看

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

沙龍一直是創作與交流的重要空間，這次 vocus 全面改版了沙龍介面，就是為了讓好內容被好好看見！你可以自由編排你的沙龍首頁版位，新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。改版完成後可以在社群媒體分享新版面，並標記 @vocus.official⁠ ♥️ ⁠

#vocus#方格子#方格子沙龍

2025/06/12

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

#vocus#方格子#方格子沙龍

2025/06/12

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

在當今快速發展的技術時代，人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程，AI和ML的應用範圍日益廣泛，為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢？

#AI#ML#人工智能

2024/07/26

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

#AI#ML#人工智能

2024/07/26

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19