27/100 貝氏回歸 🧐 基於機率的回歸模型,可以適應不確定性數據!

更新於 發佈於 閱讀時間約 11 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


27/100 第三週:監督學習(回歸)


27. 貝葉斯回歸 🧐 基於機率的回歸模型,可以適應不確定性數據!


🧐 貝葉斯回歸(Bayesian Regression)

基於機率的回歸模型,可以適應不確定性數據!

________________________________________


📌 1️⃣ 什麼是貝葉斯回歸?


貝葉斯回歸(Bayesian Regression) 是一種基於 貝葉斯統計(Bayesian Statistics) 的回歸方法,它與傳統的 最小二乘回歸(OLS) 最大的不同點在於:

考慮模型的不確定性(Uncertainty)

使用機率分佈來描述模型參數(而不是單一數值)

適合小樣本數據,並且能夠適應數據的波動


📌 適用場景


小樣本數據(傳統回歸可能過擬合)

高不確定性數據(如金融市場、醫療診斷)

希望獲得模型參數的機率分佈(可進一步做決策)

________________________________________


📌 2️⃣ 貝葉斯回歸 vs. 傳統回歸


普通線性回歸的目標是直接找到一組最佳權重(w),建立出一個固定的回歸方程式,並且不會特別考慮模型中的不確定性,因此通常需要大量數據來達到良好的預測效果。而貝葉斯回歸則是進一步考慮了模型中的不確定性,透過機率分佈來描述權重的可能性範圍,即使在小樣本數據的情況下也能有效運作,最終產出的不再是一個單一的回歸方程式,而是權重與預測結果的機率分佈,提供更豐富的決策依據。


如果你需要,我也可以幫你做一個更進一步的比喻或圖表!


✅ 貝葉斯回歸適合不確定性高、小數據集的應用!

________________________________________


📌 3️⃣ 貝葉斯回歸的數學原理


🎯 傳統回歸模型


線性回歸的目標是 最小化誤差,尋找最佳參數 w:

y=wX+b

我們希望找到最小的 均方誤差(MSE):


「MSE 衡量的是預測結果和實際結果之間的平均平方誤差,數值越小表示模型預測越精準。」


________________________________________


🎯 貝葉斯回歸的貝葉斯公式


貝葉斯回歸使用 貝葉斯定理 來計算參數的機率分佈:


P(w∣X,y) = P(y∣X,w) * P(w) / P(y∣X)


P(w∣X,y)→ 後驗機率(Posterior),表示根據數據得到的 w 的分佈


P(y∣X,w) → 似然函數(Likelihood),表示數據對 w 的影響


P(w)→ 先驗機率(Prior),表示我們對 w 的先驗知識


P(y∣X)→ 證據(Evidence),是規模化常數


📌 直觀解釋


普通回歸 找出最可能的 w

貝葉斯回歸 找出 w 的機率分佈,能夠反映數據的不確定性

________________________________________


📌 4️⃣ Python 實作:貝葉斯回歸


我們將比較:


1. 普通線性回歸

2. 貝葉斯回歸(Bayesian Ridge Regression)

________________________________________


✅ (1) 產生數據


python


import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.linear_model import LinearRegression, BayesianRidge

from sklearn.model_selection import train_test_split

from sklearn.metrics import mean_squared_error, r2_score


# 產生非線性數據(房價 vs. 房屋面積)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 100000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價(含隨機噪聲)


# 繪製數據

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積(非線性數據)")

plt.legend()

plt.show()


📌 數據包含隨機波動,適合測試貝葉斯回歸的抗干擾能力!

________________________________________


✅ (2) 訓練普通線性回歸 vs. 貝葉斯回歸


python


# 分割數據

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


# 🔹 普通線性回歸

lin_reg = LinearRegression()

lin_reg.fit(X_train, y_train)


# 🔹 貝葉斯回歸

bayes_reg = BayesianRidge()

bayes_reg.fit(X_train, y_train)

________________________________________


✅ (3) 預測與評估


python


# 預測

y_pred_lin = lin_reg.predict(X_test)

y_pred_bayes = bayes_reg.predict(X_test)


# 計算 MSE 和 R²

mse_lin = mean_squared_error(y_test, y_pred_lin)

r2_lin = r2_score(y_test, y_pred_lin)


mse_bayes = mean_squared_error(y_test, y_pred_bayes)

r2_bayes = r2_score(y_test, y_pred_bayes)


print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"貝葉斯回歸 - MSE: {mse_bayes:.2f}, R²: {r2_bayes:.4f}")


📌 結果示例:


線性回歸 - MSE: 2.5e+9, R²: 0.89

貝葉斯回歸 - MSE: 2.1e+9, R²: 0.92


📌 解讀


貝葉斯回歸的 MSE 更低(誤差小)

R² 更接近 1,表示擬合效果更佳

貝葉斯回歸對噪音較大的數據更有穩健性

________________________________________


✅ (4) 視覺化預測曲線


python


# 產生更多測試點來畫曲線

X_grid = np.linspace(min(X), max(X), 100).reshape(-1, 1)

y_pred_bayes_curve = bayes_reg.predict(X_grid)


# 繪製結果

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X_grid, lin_reg.predict(X_grid), color='red', linewidth=2, label="線性回歸")

plt.plot(X_grid, y_pred_bayes_curve, color='green', linewidth=2, label="貝葉斯回歸")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("貝葉斯回歸 vs. 線性回歸")

plt.legend()

plt.show()


📌 結果

線性回歸(紅色):無法考慮不確定性

貝葉斯回歸(綠色):更平滑,且能適應數據變化

________________________________________


📌 5️⃣ 貝葉斯回歸的優缺點


✅ 優點


適用於小數據集

可以處理不確定性數據

更不容易過擬合(因為有先驗機率調整)


⚠ 缺點


計算成本較高

結果是機率分佈,不容易直觀解釋

________________________________________


🎯 總結


✅ 貝葉斯回歸適合不確定性高、小數據集的應用!

✅ 對噪聲數據更具穩健性,能適應波動!

✅ 適合醫療、金融、風險評估等應用!


🚀 下一步:XGBoost 回歸來提升預測能力!🌲🔥


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
3會員
106內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/27
支援向量回歸(SVR)透過「ε 容忍管」忽略微小誤差,再以最大間隔尋找最平滑超平面,能優雅擬合高度非線性資料。搭配 RBF 內核,不需大量特徵工程即可大幅降低 MSE、提升 R²,且對離群點更具韌性。若想在中小型複雜數據集獲得精準回歸,SVR 絕對是高 CP 值選擇。
Thumbnail
2025/05/27
支援向量回歸(SVR)透過「ε 容忍管」忽略微小誤差,再以最大間隔尋找最平滑超平面,能優雅擬合高度非線性資料。搭配 RBF 內核,不需大量特徵工程即可大幅降低 MSE、提升 R²,且對離群點更具韌性。若想在中小型複雜數據集獲得精準回歸,SVR 絕對是高 CP 值選擇。
Thumbnail
2025/05/27
決策樹回歸像玩二十問答,逐層條件分割資料區間,以均值擬合非線性趨勢;免除繁瑣特徵工程也能大幅降低預測誤差,且保留直觀可解釋性。透過調整樹深即可抑制過擬合,是快速上手的靈活回歸利器,在房價估值、銷售預測等場景尤其實用。
Thumbnail
2025/05/27
決策樹回歸像玩二十問答,逐層條件分割資料區間,以均值擬合非線性趨勢;免除繁瑣特徵工程也能大幅降低預測誤差,且保留直觀可解釋性。透過調整樹深即可抑制過擬合,是快速上手的靈活回歸利器,在房價估值、銷售預測等場景尤其實用。
Thumbnail
2025/05/27
多項式回歸,透過加入二次、三次等高次項,把直線變曲線,輕鬆捕捉房價、疾病進展等常見非線性趨勢。若你的散點圖呈彎曲,資料量又不大,使用 degree 2-3 的多項式回歸即可大幅降低 MSE、提升 R²,同時避免深度模型的高成本與複雜度。快速、易實作、效果顯著,是入門者解決非線性問題的首選利器!
Thumbnail
2025/05/27
多項式回歸,透過加入二次、三次等高次項,把直線變曲線,輕鬆捕捉房價、疾病進展等常見非線性趨勢。若你的散點圖呈彎曲,資料量又不大,使用 degree 2-3 的多項式回歸即可大幅降低 MSE、提升 R²,同時避免深度模型的高成本與複雜度。快速、易實作、效果顯著,是入門者解決非線性問題的首選利器!
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
在這個充滿不確定性的AI時代,如何以不變應萬變?本文引用了《AI世界的底層邏輯與生存法則》中的觀點,強調成長型思維和專題式學習的重要性,幫助你在職場中脫穎而出,實現倍數成長。
Thumbnail
在這個充滿不確定性的AI時代,如何以不變應萬變?本文引用了《AI世界的底層邏輯與生存法則》中的觀點,強調成長型思維和專題式學習的重要性,幫助你在職場中脫穎而出,實現倍數成長。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News