27/100 貝氏回歸 🧐 基於機率的回歸模型,可以適應不確定性數據!

更新 發佈閱讀 11 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


27/100 第三週:監督學習(回歸)


27. 貝葉斯回歸 🧐 基於機率的回歸模型,可以適應不確定性數據!


🧐 貝葉斯回歸(Bayesian Regression)

基於機率的回歸模型,可以適應不確定性數據!

________________________________________


📌 1️⃣ 什麼是貝葉斯回歸?


貝葉斯回歸(Bayesian Regression) 是一種基於 貝葉斯統計(Bayesian Statistics) 的回歸方法,它與傳統的 最小二乘回歸(OLS) 最大的不同點在於:

考慮模型的不確定性(Uncertainty)

使用機率分佈來描述模型參數(而不是單一數值)

適合小樣本數據,並且能夠適應數據的波動


📌 適用場景


小樣本數據(傳統回歸可能過擬合)

高不確定性數據(如金融市場、醫療診斷)

希望獲得模型參數的機率分佈(可進一步做決策)

________________________________________


📌 2️⃣ 貝葉斯回歸 vs. 傳統回歸


普通線性回歸的目標是直接找到一組最佳權重(w),建立出一個固定的回歸方程式,並且不會特別考慮模型中的不確定性,因此通常需要大量數據來達到良好的預測效果。而貝葉斯回歸則是進一步考慮了模型中的不確定性,透過機率分佈來描述權重的可能性範圍,即使在小樣本數據的情況下也能有效運作,最終產出的不再是一個單一的回歸方程式,而是權重與預測結果的機率分佈,提供更豐富的決策依據。


如果你需要,我也可以幫你做一個更進一步的比喻或圖表!


✅ 貝葉斯回歸適合不確定性高、小數據集的應用!

________________________________________


📌 3️⃣ 貝葉斯回歸的數學原理


🎯 傳統回歸模型


線性回歸的目標是 最小化誤差,尋找最佳參數 w:

y=wX+b

我們希望找到最小的 均方誤差(MSE):


「MSE 衡量的是預測結果和實際結果之間的平均平方誤差,數值越小表示模型預測越精準。」


________________________________________


🎯 貝葉斯回歸的貝葉斯公式


貝葉斯回歸使用 貝葉斯定理 來計算參數的機率分佈:


P(w∣X,y) = P(y∣X,w) * P(w) / P(y∣X)


P(w∣X,y)→ 後驗機率(Posterior),表示根據數據得到的 w 的分佈


P(y∣X,w) → 似然函數(Likelihood),表示數據對 w 的影響


P(w)→ 先驗機率(Prior),表示我們對 w 的先驗知識


P(y∣X)→ 證據(Evidence),是規模化常數


📌 直觀解釋


普通回歸 找出最可能的 w

貝葉斯回歸 找出 w 的機率分佈,能夠反映數據的不確定性

________________________________________


📌 4️⃣ Python 實作:貝葉斯回歸


我們將比較:


1. 普通線性回歸

2. 貝葉斯回歸(Bayesian Ridge Regression)

________________________________________


✅ (1) 產生數據


python


import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.linear_model import LinearRegression, BayesianRidge

from sklearn.model_selection import train_test_split

from sklearn.metrics import mean_squared_error, r2_score


# 產生非線性數據(房價 vs. 房屋面積)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 100000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價(含隨機噪聲)


# 繪製數據

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積(非線性數據)")

plt.legend()

plt.show()


📌 數據包含隨機波動,適合測試貝葉斯回歸的抗干擾能力!

________________________________________


✅ (2) 訓練普通線性回歸 vs. 貝葉斯回歸


python


# 分割數據

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


# 🔹 普通線性回歸

lin_reg = LinearRegression()

lin_reg.fit(X_train, y_train)


# 🔹 貝葉斯回歸

bayes_reg = BayesianRidge()

bayes_reg.fit(X_train, y_train)

________________________________________


✅ (3) 預測與評估


python


# 預測

y_pred_lin = lin_reg.predict(X_test)

y_pred_bayes = bayes_reg.predict(X_test)


# 計算 MSE 和 R²

mse_lin = mean_squared_error(y_test, y_pred_lin)

r2_lin = r2_score(y_test, y_pred_lin)


mse_bayes = mean_squared_error(y_test, y_pred_bayes)

r2_bayes = r2_score(y_test, y_pred_bayes)


print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"貝葉斯回歸 - MSE: {mse_bayes:.2f}, R²: {r2_bayes:.4f}")


📌 結果示例:


線性回歸 - MSE: 2.5e+9, R²: 0.89

貝葉斯回歸 - MSE: 2.1e+9, R²: 0.92


📌 解讀


貝葉斯回歸的 MSE 更低(誤差小)

R² 更接近 1,表示擬合效果更佳

貝葉斯回歸對噪音較大的數據更有穩健性

________________________________________


✅ (4) 視覺化預測曲線


python


# 產生更多測試點來畫曲線

X_grid = np.linspace(min(X), max(X), 100).reshape(-1, 1)

y_pred_bayes_curve = bayes_reg.predict(X_grid)


# 繪製結果

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X_grid, lin_reg.predict(X_grid), color='red', linewidth=2, label="線性回歸")

plt.plot(X_grid, y_pred_bayes_curve, color='green', linewidth=2, label="貝葉斯回歸")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("貝葉斯回歸 vs. 線性回歸")

plt.legend()

plt.show()


📌 結果

線性回歸(紅色):無法考慮不確定性

貝葉斯回歸(綠色):更平滑,且能適應數據變化

________________________________________


📌 5️⃣ 貝葉斯回歸的優缺點


✅ 優點


適用於小數據集

可以處理不確定性數據

更不容易過擬合(因為有先驗機率調整)


⚠ 缺點


計算成本較高

結果是機率分佈,不容易直觀解釋

________________________________________


🎯 總結


✅ 貝葉斯回歸適合不確定性高、小數據集的應用!

✅ 對噪聲數據更具穩健性,能適應波動!

✅ 適合醫療、金融、風險評估等應用!


🚀 下一步:XGBoost 回歸來提升預測能力!🌲🔥


留言
avatar-img
艾韓思 AIHANS|AI 應用工程筆記
33會員
669內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
2025/05/27
支援向量回歸(SVR)透過「ε 容忍管」忽略微小誤差,再以最大間隔尋找最平滑超平面,能優雅擬合高度非線性資料。搭配 RBF 內核,不需大量特徵工程即可大幅降低 MSE、提升 R²,且對離群點更具韌性。若想在中小型複雜數據集獲得精準回歸,SVR 絕對是高 CP 值選擇。
Thumbnail
2025/05/27
支援向量回歸(SVR)透過「ε 容忍管」忽略微小誤差,再以最大間隔尋找最平滑超平面,能優雅擬合高度非線性資料。搭配 RBF 內核,不需大量特徵工程即可大幅降低 MSE、提升 R²,且對離群點更具韌性。若想在中小型複雜數據集獲得精準回歸,SVR 絕對是高 CP 值選擇。
Thumbnail
2025/05/27
決策樹回歸像玩二十問答,逐層條件分割資料區間,以均值擬合非線性趨勢;免除繁瑣特徵工程也能大幅降低預測誤差,且保留直觀可解釋性。透過調整樹深即可抑制過擬合,是快速上手的靈活回歸利器,在房價估值、銷售預測等場景尤其實用。
Thumbnail
2025/05/27
決策樹回歸像玩二十問答,逐層條件分割資料區間,以均值擬合非線性趨勢;免除繁瑣特徵工程也能大幅降低預測誤差,且保留直觀可解釋性。透過調整樹深即可抑制過擬合,是快速上手的靈活回歸利器,在房價估值、銷售預測等場景尤其實用。
Thumbnail
2025/05/27
多項式回歸,透過加入二次、三次等高次項,把直線變曲線,輕鬆捕捉房價、疾病進展等常見非線性趨勢。若你的散點圖呈彎曲,資料量又不大,使用 degree 2-3 的多項式回歸即可大幅降低 MSE、提升 R²,同時避免深度模型的高成本與複雜度。快速、易實作、效果顯著,是入門者解決非線性問題的首選利器!
Thumbnail
2025/05/27
多項式回歸,透過加入二次、三次等高次項,把直線變曲線,輕鬆捕捉房價、疾病進展等常見非線性趨勢。若你的散點圖呈彎曲,資料量又不大,使用 degree 2-3 的多項式回歸即可大幅降低 MSE、提升 R²,同時避免深度模型的高成本與複雜度。快速、易實作、效果顯著,是入門者解決非線性問題的首選利器!
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
在這個充滿不確定性的AI時代,如何以不變應萬變?本文引用了《AI世界的底層邏輯與生存法則》中的觀點,強調成長型思維和專題式學習的重要性,幫助你在職場中脫穎而出,實現倍數成長。
Thumbnail
在這個充滿不確定性的AI時代,如何以不變應萬變?本文引用了《AI世界的底層邏輯與生存法則》中的觀點,強調成長型思維和專題式學習的重要性,幫助你在職場中脫穎而出,實現倍數成長。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News