模型準不準?看這個分數就知道!一分鐘搞懂 R² 決定係數

更新 發佈閱讀 4 分鐘

R-square(決定係數,R2)是用在迴歸任務中,衡量模型解釋目標變數變異(波動)程度的一個指標。

1. 底層邏輯:它在衡量什麼?

想像你在預測房價。房價總是在波動,有些貴、有些便宜。R2就是在回答這個問題:「我的模型到底解釋了房價總波動中的多少比例?」。

  • 總體波動(TSS, Total Sum of Squares):這是你所有房價資料距離「平均房價」的總差距。它代表了資料本身固有的總變異量。
  • 模型誤差(RSS, Residual Sum of Squares):這是你的模型「預測出來的房價」與「實際房價」之間的總差距。

R2的計算,就是用總波動減去模型誤差後,看看還剩下多少比例的波動是被你的模型成功解釋的。

R2 = 1 - \frac{\text{模型殘差平方和 (RSS)}}{\text{總變異平方和 (TSS)}} \quad $$

2. 一句話總結:

簡單來說,它就是一個分數,告訴你你的迴歸模型到底解釋了多少資料的總體波動,數值越接近 $1$,代表你的模型越神準!


知識點延伸:R-square的判讀與應用

$R^2$的值介於 $0$ 到 $1$ 之間,透過理解這個範圍,我們可以判斷模型的效能:

R² 值範圍意義解釋 (生活化)模型的解釋力結論R² ≈ 1你的模型神準!幾乎所有房價的漲跌都被模型抓住了。強 (完美擬合)模型非常可靠。R² ≈ 0.5模型解釋了一半的波動,還不錯,但仍有一半的變異量是未知因素。中等模型具一定參考價值。R² ≈ 0你的模型跟「猜平均數」沒兩樣,沒有任何解釋能力。弱 (基準線)模型無效,需要調整。R² < 0你的模型比直接猜平均值還爛!負向 (非常弱)模型設計有嚴重問題。

$R^2$常用於評估多種迴歸模型,例如:線性迴歸、Lasso 迴歸、嶺迴歸(Ridge Regression)、支援向量迴歸(SVR)、以及決策樹迴歸(Decision Tree Regressor)。


應用案例:手搖飲店長的焦慮

假設你是一名**「頂尖手搖飲店長」**,想預測明天會賣出幾杯珍珠奶茶(連續數值)。

場景:店長老王與 AI 規劃師

店長老王:「我訓練了一個模型,想知道明天奶茶銷售量,我的 $R^2$ 是 $0.2$。這是不是代表我的模型有 $20%$ 的準確度?」

iPAS AI 規劃師(你):「老王,冷靜點!$R^2$不是準確率,它是解釋力!$R^2 = 0.2$ 意味著,你的模型只解釋了每日奶茶銷售量總波動中的 20%。剩下的 $80%$ 波動(可能是天氣、競爭者、隔壁工地噪音等)你的模型根本沒捕捉到!」

老王:「啊!那我該怎麼改進?」

iPAS AI 規劃師(你):「你需要把天氣、氣溫、甚至是隔壁午餐特價日等變數加進去。當你加入氣溫這個強大特徵後,如果你的 $R^2$ 飆升到 $0.75$,這才代表你的模型成功解釋了 75% 的銷售波動,遠比你光靠猜平均值要好得多!」

這個例子告訴我們:

  1. $R^2$ 是一個相對指標,它的基準線是 $0$(即只猜平均數)。
  2. 提高 $R^2$ 的關鍵,是找到能解釋目標變數波動的關鍵特徵。
留言
avatar-img
留言分享你的想法!
avatar-img
iPAS AI 自學路
0會員
19內容數
我是一位正在追求職涯升級的 40 歲非本科系上班族。我會將自己摸索出的高效白話筆記與聽覺學習法無私分享,助你:克服術語障礙、利用零碎時間學習、系統化整理考點。 也歡迎到我的頻道逛逛https://www.youtube.com/@ipasstudybuddy
iPAS AI 自學路的其他內容
2025/10/15
資料處理與分析是 AI 專案中的基礎階段,它的主要目標,就是將那些雜亂無章的原始數據(Raw Data)轉化成高品質、適合模型分析的格式,最終從中提取出我們需要的「黃金情報」(有價值的資訊)。而「資料蒐集 (Data Collection)」就是這個宏大工程的第一步,是我們獲取數據的過程。 1.
2025/10/15
資料處理與分析是 AI 專案中的基礎階段,它的主要目標,就是將那些雜亂無章的原始數據(Raw Data)轉化成高品質、適合模型分析的格式,最終從中提取出我們需要的「黃金情報」(有價值的資訊)。而「資料蒐集 (Data Collection)」就是這個宏大工程的第一步,是我們獲取數據的過程。 1.
2025/10/15
資料(數據)處理與分析,就是將海量的原始數據(Raw Data)轉變成高品質、可分析格式的過程。這是所有 AI 專案的基礎。統計學(Statistics)就是我們駕馭資料、獲得洞見的指南針。 知識點拆解:資料處理的四大天王 整個資料處理流程可以拆解為四大核心步驟: 1. 數據蒐集 (Data
2025/10/15
資料(數據)處理與分析,就是將海量的原始數據(Raw Data)轉變成高品質、可分析格式的過程。這是所有 AI 專案的基礎。統計學(Statistics)就是我們駕馭資料、獲得洞見的指南針。 知識點拆解:資料處理的四大天王 整個資料處理流程可以拆解為四大核心步驟: 1. 數據蒐集 (Data
2025/10/15
1. 專有名詞拆解:AI 的定義與本質 專有名詞:人工智慧 (Artificial Intelligence, AI) 技術原理/底層邏輯: AI 是一種模擬人類智慧的技術,核心目標是讓機器能夠執行原本需要人類智慧才能完成的任務。這包含了學習、推理、解決問題和感知環境等能力。 關鍵發展驅動力:
2025/10/15
1. 專有名詞拆解:AI 的定義與本質 專有名詞:人工智慧 (Artificial Intelligence, AI) 技術原理/底層邏輯: AI 是一種模擬人類智慧的技術,核心目標是讓機器能夠執行原本需要人類智慧才能完成的任務。這包含了學習、推理、解決問題和感知環境等能力。 關鍵發展驅動力:
看更多
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
依照中央極限定理,我們可以得知(獨立且隨機樣本的)抽樣分布最終會形成常態分佈,那麼這件事情到底為什麼很重要呢? 這篇文章就來介紹一些常態分布的基本特性,以及最重要的──常態分布怎麼幫助我們計算機率。
Thumbnail
由 醜媳婦總是要見公婆-績效報表 的最佳化報表可知,無論我們將連續創高或創低的K棒數如何改變,均不可能讓淨利變正,代表我們不可能靠單一個指標值來獲利,此時改善方式只能再回到觀察圖表,由圖表中的訊號觀察是否有什麼改善方式。 由圖表中可發現當標示的紅點或綠點離均線越遠,則進場的時機點越好,如果可以增加
Thumbnail
由 醜媳婦總是要見公婆-績效報表 的最佳化報表可知,無論我們將連續創高或創低的K棒數如何改變,均不可能讓淨利變正,代表我們不可能靠單一個指標值來獲利,此時改善方式只能再回到觀察圖表,由圖表中的訊號觀察是否有什麼改善方式。 由圖表中可發現當標示的紅點或綠點離均線越遠,則進場的時機點越好,如果可以增加
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News