21/100 線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!

更新 發佈閱讀 8 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


21/100 第三週:監督學習(回歸)


21.線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!


監督學習(回歸) 的第一部分,將介紹 線性回歸(Linear Regression),它是機器學習中最基本且重要的模型之一。適合用來預測連續數據,如 房價、收入、溫度、銷售額 等。

________________________________________


📌 線性回歸(Linear Regression)


線性回歸 是 最簡單的機器學習模型,它假設輸入特徵與輸出之間存在線性關係,並使用一條直線來擬合數據。

________________________________________


1️⃣ 線性回歸的基本概念


🎯 目標


找出一條最佳直線來預測連續變數 y,滿足:


y=wX+b


其中:

y 是 目標值(預測值)

X 是 輸入特徵

w 是 權重(斜率)

b 是 截距(bias)


示例:預測房價 假設 X=房屋面積(平方公尺),y=房價(萬元):


房價=5000×面積+10


這表示:


每增加 1 平方公尺,房價增加 5000 萬元

當面積為 0,房價為 10 萬元(截距)

________________________________________


2️⃣ 如何尋找最佳直線?


使用最小二乘法(Least Squares Method) 來找到最佳的 w 和 b,讓預測值 y^與實際值 之間的誤差最小。


誤差衡量方式:均方誤差(MSE)


均方誤差的文字描述可以這樣表達: 「先計算每筆資料的『預測值減實際值』之差,再將這些差值平方後求平均,就是均方誤差。」


目標:調整 w,b 讓 MSE 最小化。

方法:

解析解(Closed-form Solution):直接計算最優解(適用於小數據)

梯度下降(Gradient Descent):反覆調整 w,b(適用於大數據)

________________________________________


3️⃣ Python 實作:簡單線性回歸


我們使用 sklearn 來建立 線性回歸模型,並用它來預測房價。


✅ (1) 生成數據


python


import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression


# 產生隨機房屋面積數據(平方公尺)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 10000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價(加入隨機噪聲)


# 繪製數據點

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

________________________________________


✅ (2) 訓練線性回歸模型


python


# 創建線性回歸模型

model = LinearRegression()


# 訓練模型

model.fit(X, y)


# 獲取最佳參數

w = model.coef_[0][0] # 斜率

b = model.intercept_[0] # 截距


print(f"線性回歸方程:房價 = {w:.2f} * 面積 + {b:.2f}")

________________________________________


✅ (3) 預測與視覺化


python


# 預測房價

y_pred = model.predict(X)


# 繪製回歸線

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred, color='red', linewidth=2, label="預測直線")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("線性回歸模型")

plt.legend()

plt.show()


📌 結果: 一條紅色直線擬合數據,代表模型的預測結果。

________________________________________


4️⃣ 模型評估


為了評估線性回歸的表現,我們使用 R² 決定係數(R-squared) 和 均方誤差(MSE)。


python


from sklearn.metrics import mean_squared_error, r2_score


# 計算 MSE

mse = mean_squared_error(y, y_pred)


# 計算 R² 分數

r2 = r2_score(y, y_pred)


print(f"MSE(均方誤差):{mse:.2f}")

print(f"R² 決定係數:{r2:.4f}")


📌 R²(決定係數)

範圍:0 ~ 1

越接近 1,模型擬合效果越好

若 R² 很低,可能需要增加特徵或考慮非線性模型

________________________________________


線性回歸的優缺點


🎯 優點


✅ 簡單易懂,計算效率高

✅ 結果具有可解釋性(每個特徵的影響力明確)

✅ 適用於數據線性關係明顯的問題


⚠ 缺點


❌ 無法處理非線性關係(如房價 vs. 需求變化)

❌ 容易受異常值影響(Outliers)

❌ 假設數據無共線性(多個變數不應該高度相關)

________________________________________


📌 結論


✅ 線性回歸是機器學習中最基本的回歸模型

✅ 適用於預測「連續數據」,如 房價、銷售額、溫度

✅ 可擴展為多元線性回歸來處理多個變數

✅ 若數據呈非線性關係,需考慮 多項式回歸或決策樹回歸


🚀 下一步:深入探索多元回歸模型! 🎯


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
16會員
388內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
看更多
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News