AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》
30/100 第三週:監督學習(回歸)
30. 小結與測驗-回歸模型評估(MSE, RMSE, MAE, R²) 🏆 衡量預測誤差,確保模型表現優良!
本章介紹了 回歸分析 的各種方法,從最基本的 線性回歸 到進階的 深度學習回歸(ANN),適用於不同類型的數據。最後,我們將學習 回歸模型的評估指標,確保選擇最佳的回歸方法。
________________________________________
📌 回歸模型總結
🔹傳統回歸
當我們選擇傳統回歸模型時,可以根據數據特性靈活應用:如果是單一變數且關係線性,可以採用簡單明瞭的📈線性回歸。
當變數較多且關係複雜時,📊多元線性回歸能提供更準確的預測,但要留意共線性問題。
若想降低過擬合風險,提升模型穩定性,則可以考慮使用🎛正則化回歸如 Lasso、Ridge 或 ElasticNet,雖然參數設定較多,但能有效控制模型複雜度。
而面對非線性數據時,🏛 多項式回歸則能更好地擬合曲線趨勢,但需注意避免過擬合的風險。總體而言,根據數據特性選擇合適模型,才能兼顧解釋力與預測能力。
________________________________________
🔹 基於樹的回歸
決策樹回歸 🌳 :透過分割數據點預測,容易解釋 容易過擬合
XGBoost 回歸 🚀 :競賽冠軍算法 高準確率,速度快 參數調整較多
________________________________________
🔹 進階回歸
進階回歸模型能處理更複雜、多變的數據場景:
🔥 支援向量回歸(SVR) 透過超平面尋找最佳預測點,特別適合高維數據,但需要數據標準化且計算量較大;
🧐 貝葉斯回歸 基於機率分佈,能靈活應對不確定性數據,提升預測的可信度,不過計算成本相對較高;
🤖 深度學習回歸(ANN) 擁有強大的模式學習能力,能捕捉隱藏在數據中的深層結構,雖然訓練時間較長且模型不易解釋,但在複雜任務中具有極高潛力。
整體而言,進階回歸模型雖然運算成本較高,但能顯著提升對複雜數據的適應性與預測表現,適合面對高不確定性或多變數、非線性的挑戰場景。
________________________________________
📌 回歸模型評估指標
我們使用以下 誤差指標 來衡量模型的預測能力:
指標 公式 主要用途
🔍 MSE(均方誤差):測量預測值與真實值的平方差,對極端誤差敏感
📏RMSE(均方根誤差):RMSE=MSE 的平方根,使誤差單位與原數據相同
🧩MAE(平均絕對誤差)=計算預測值與真實值差異的絕對值平均,對極端值較不敏感,易於解釋
🎯R²(決定係數)=衡量模型對變異量的解釋程度,R² 越接近 1,表示模型解釋能力越強。
📌 重點:
• MSE、RMSE 越小越好
• MAE 適合含有異常值的數據
• R² 越接近 1,模型擬合越好
________________________________________
📌 3小測驗:回歸模型評估
請回答以下問題來測試你對回歸模型的理解!
🎯 問題 1:MSE 和 RMSE 的主要區別是什麼?
A) RMSE 具有相同的單位
B) MSE 和 RMSE 計算方式相同
C) RMSE 和 MAE 相同
D) RMSE 是 MSE 的平方
✅ 正確答案:A
📌 RMSE 讓誤差與原數據的單位相同,更易於解釋。
________________________________________
🎯 問題 2:哪個指標適合處理含有極端值的數據?
A) MSE
B) RMSE
C) MAE
D) R²
✅ 正確答案:C
📌 MAE 只計算絕對差異,不受極端值的平方影響,因此適合含有異常值的數據。
________________________________________
🎯 問題 3:當 R² 接近 1 時,代表什麼?
A) 模型過擬合
B) 模型擬合度高
C) 模型無法解釋變異數
D) 模型一定適用所有數據
✅ 正確答案:B
📌 R² 接近 1,表示模型可以很好地解釋數據的變異性,但若 R² 過高,可能存在過擬合問題!
________________________________________
🎯 問題 4:哪種回歸方法最適合處理高度非線性數據?
A) 線性回歸
B) 決策樹回歸
C) XGBoost
D) ANN 回歸
✅ 正確答案:D
📌 ANN(深度學習回歸)適合處理高度非線性數據,能自動學習複雜的數據模式。
________________________________________
📌 總結
✅ 回歸模型從線性回歸到深度學習回歸,各有適用場景
✅ 使用 MSE、RMSE、MAE、R² 來評估模型準確性
✅ 不同回歸方法適合不同的應用場景,根據數據特性選擇最適合的模型!