21/100 線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!

更新於 發佈於 閱讀時間約 8 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


21/100 第三週:監督學習(回歸)


21.線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!


監督學習(回歸) 的第一部分,將介紹 線性回歸(Linear Regression),它是機器學習中最基本且重要的模型之一。適合用來預測連續數據,如 房價、收入、溫度、銷售額 等。

________________________________________


📌 線性回歸(Linear Regression)


線性回歸 是 最簡單的機器學習模型,它假設輸入特徵與輸出之間存在線性關係,並使用一條直線來擬合數據。

________________________________________


1️⃣ 線性回歸的基本概念


🎯 目標


找出一條最佳直線來預測連續變數 y,滿足:


y=wX+b


其中:

y 是 目標值(預測值)

X 是 輸入特徵

w 是 權重(斜率)

b 是 截距(bias)


示例:預測房價 假設 X=房屋面積(平方公尺),y=房價(萬元):


房價=5000×面積+10


這表示:


每增加 1 平方公尺,房價增加 5000 萬元

當面積為 0,房價為 10 萬元(截距)

________________________________________


2️⃣ 如何尋找最佳直線?


使用最小二乘法(Least Squares Method) 來找到最佳的 w 和 b,讓預測值 y^與實際值 之間的誤差最小。


誤差衡量方式:均方誤差(MSE)


均方誤差的文字描述可以這樣表達: 「先計算每筆資料的『預測值減實際值』之差,再將這些差值平方後求平均,就是均方誤差。」


目標:調整 w,b 讓 MSE 最小化。

方法:

解析解(Closed-form Solution):直接計算最優解(適用於小數據)

梯度下降(Gradient Descent):反覆調整 w,b(適用於大數據)

________________________________________


3️⃣ Python 實作:簡單線性回歸


我們使用 sklearn 來建立 線性回歸模型,並用它來預測房價。


✅ (1) 生成數據


python


import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression


# 產生隨機房屋面積數據(平方公尺)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 10000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價(加入隨機噪聲)


# 繪製數據點

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

________________________________________


✅ (2) 訓練線性回歸模型


python


# 創建線性回歸模型

model = LinearRegression()


# 訓練模型

model.fit(X, y)


# 獲取最佳參數

w = model.coef_[0][0] # 斜率

b = model.intercept_[0] # 截距


print(f"線性回歸方程:房價 = {w:.2f} * 面積 + {b:.2f}")

________________________________________


✅ (3) 預測與視覺化


python


# 預測房價

y_pred = model.predict(X)


# 繪製回歸線

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred, color='red', linewidth=2, label="預測直線")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("線性回歸模型")

plt.legend()

plt.show()


📌 結果: 一條紅色直線擬合數據,代表模型的預測結果。

________________________________________


4️⃣ 模型評估


為了評估線性回歸的表現,我們使用 R² 決定係數(R-squared) 和 均方誤差(MSE)。


python


from sklearn.metrics import mean_squared_error, r2_score


# 計算 MSE

mse = mean_squared_error(y, y_pred)


# 計算 R² 分數

r2 = r2_score(y, y_pred)


print(f"MSE(均方誤差):{mse:.2f}")

print(f"R² 決定係數:{r2:.4f}")


📌 R²(決定係數)

範圍:0 ~ 1

越接近 1,模型擬合效果越好

若 R² 很低,可能需要增加特徵或考慮非線性模型

________________________________________


線性回歸的優缺點


🎯 優點


✅ 簡單易懂,計算效率高

✅ 結果具有可解釋性(每個特徵的影響力明確)

✅ 適用於數據線性關係明顯的問題


⚠ 缺點


❌ 無法處理非線性關係(如房價 vs. 需求變化)

❌ 容易受異常值影響(Outliers)

❌ 假設數據無共線性(多個變數不應該高度相關)

________________________________________


📌 結論


✅ 線性回歸是機器學習中最基本的回歸模型

✅ 適用於預測「連續數據」,如 房價、銷售額、溫度

✅ 可擴展為多元線性回歸來處理多個變數

✅ 若數據呈非線性關係,需考慮 多項式回歸或決策樹回歸


🚀 下一步:深入探索多元回歸模型! 🎯


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
3會員
106內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News