21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

Hansen W

發佈於AI科技機器學習修煉坊

2025/05/27 更新2025/05/27 發佈閱讀 8 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

21/100 第三週：監督學習（回歸）

21.線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

監督學習（回歸）的第一部分，將介紹線性回歸（Linear Regression），它是機器學習中最基本且重要的模型之一。適合用來預測連續數據，如房價、收入、溫度、銷售額等。

________________________________________

📌 線性回歸（Linear Regression）

線性回歸是最簡單的機器學習模型，它假設輸入特徵與輸出之間存在線性關係，並使用一條直線來擬合數據。

________________________________________

1️⃣ 線性回歸的基本概念

🎯 目標

找出一條最佳直線來預測連續變數 y，滿足：

y=wX+b

其中：

• y 是目標值（預測值）

• X 是輸入特徵

• w 是權重（斜率）

• b 是截距（bias）

示例：預測房價假設 X=房屋面積（平方公尺），y=房價（萬元）：

房價=5000×面積+10

這表示：

• 每增加 1 平方公尺，房價增加 5000 萬元

• 當面積為 0，房價為 10 萬元（截距）

________________________________________

2️⃣ 如何尋找最佳直線？

使用最小二乘法（Least Squares Method）來找到最佳的 w 和 b，讓預測值 y^與實際值之間的誤差最小。

誤差衡量方式：均方誤差（MSE）

均方誤差的文字描述可以這樣表達：「先計算每筆資料的『預測值減實際值』之差，再將這些差值平方後求平均，就是均方誤差。」

目標：調整 w,b 讓 MSE 最小化。

方法：

• 解析解（Closed-form Solution）：直接計算最優解（適用於小數據）

• 梯度下降（Gradient Descent）：反覆調整 w,b（適用於大數據）

________________________________________

3️⃣ Python 實作：簡單線性回歸

我們使用 sklearn 來建立線性回歸模型，並用它來預測房價。

✅ (1) 生成數據

python

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 產生隨機房屋面積數據（平方公尺）

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 10000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價（加入隨機噪聲）

# 繪製數據點

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

________________________________________

✅ (2) 訓練線性回歸模型

python

# 創建線性回歸模型

model = LinearRegression()

# 訓練模型

model.fit(X, y)

# 獲取最佳參數

w = model.coef_[0][0] # 斜率

b = model.intercept_[0] # 截距

print(f"線性回歸方程：房價 = {w:.2f} * 面積 + {b:.2f}")

________________________________________

✅ (3) 預測與視覺化

python

# 預測房價

y_pred = model.predict(X)

# 繪製回歸線

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred, color='red', linewidth=2, label="預測直線")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("線性回歸模型")

plt.legend()

plt.show()

📌 結果：一條紅色直線擬合數據，代表模型的預測結果。

________________________________________

4️⃣ 模型評估

為了評估線性回歸的表現，我們使用 R² 決定係數（R-squared）和均方誤差（MSE）。

python

from sklearn.metrics import mean_squared_error, r2_score

# 計算 MSE

mse = mean_squared_error(y, y_pred)

# 計算 R² 分數

r2 = r2_score(y, y_pred)

print(f"MSE（均方誤差）：{mse:.2f}")

print(f"R² 決定係數：{r2:.4f}")

📌 R²（決定係數）

• 範圍：0 ~ 1

• 越接近 1，模型擬合效果越好

• 若 R² 很低，可能需要增加特徵或考慮非線性模型

________________________________________

線性回歸的優缺點

🎯 優點

✅ 簡單易懂，計算效率高

✅ 結果具有可解釋性（每個特徵的影響力明確）

✅ 適用於數據線性關係明顯的問題

⚠ 缺點

❌ 無法處理非線性關係（如房價 vs. 需求變化）

❌ 容易受異常值影響（Outliers）

❌ 假設數據無共線性（多個變數不應該高度相關）

________________________________________

📌 結論

✅ 線性回歸是機器學習中最基本的回歸模型

✅ 適用於預測「連續數據」，如房價、銷售額、溫度

✅ 可擴展為多元線性回歸來處理多個變數

✅ 若數據呈非線性關係，需考慮多項式回歸或決策樹回歸

🚀 下一步：深入探索多元回歸模型！ 🎯

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

16會員

388內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

掌握 Pandas、NumPy，一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維！模組化範例搭配自測題，快速鞏固概念並排除常見坑，助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀，快速開啟數據科學核心能力！

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

面對類別不平衡，別再只看準確率！本單元以詐欺檢測為例，手把手示範過／欠採樣、SMOTE 與 class_weight，並教你用 Recall、F1、AUC 全面評估，讓模型真正兼顧公平與效能。理論＋程式碼雙線並進，入門實戰必看！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

2025/05/26

18/100 處理不平衡資料 ⚖ 避免 AI 偏心，讓少數類別也能被正確預測！

失衡的詐欺、醫療資料若不修正，模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight，並用 Precision、Recall、F1、AUC 評估，附 sklearn 範例，快速提升召回率，打造公平 AI，必讀！

2025/05/26

18/100 處理不平衡資料 ⚖ 避免 AI 偏心，讓少數類別也能被正確預測！

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

#懶人料理#食譜#健康甜點

2025/10/15

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19