為什麼準確率高,模型卻一團亂?用快篩案例秒懂混淆矩陣、精確率與召回率!

更新 發佈閱讀 3 分鐘

從最難懂的痛點開始

我是「iPAS AI 自學路」的創辦人。身為一位非資訊本科系40 歲中年上班族,我深知在零碎時間內,要理解iPAS證照那些艱澀的統計名詞有多痛苦。因此,我決定從我最難懂的主題——混淆矩陣精確率/召回率開始,用最白話的方式為你「翻譯」AI 決策的核心。

我們就用大家最熟悉的COVID-19快篩,來當作我們評估的AI模型。



一、 混淆矩陣:快篩結果的四種情境

我們不能只看快篩的「總分」(準確度),必須知道它「錯在哪裡」。混淆矩陣(Confusion Matrix)就是這份篩檢結果的診斷報告,將判斷結果分成兩大類共四種情境:

✅ 正確的結果(快篩判斷正確!)

  1. TP (真陽性): 抓對了!(神準)實際已感染,快篩結果為陽性。
  2. TN (真陰性): 排除了!(安全)實際未感染,快篩結果為陰性。

❌ 錯誤的結果(快篩搞混了!)

  1. FP (偽陽性): 誤殺了!(虛驚一場)實際未感染,但快篩卻呈現陽性。後果是造成不必要的隔離、PCR資源浪費,這就是「誤判成本」。
  2. FN (偽陰性): 漏掉了!(潛在危機)實際已感染,但快篩卻呈現陰性。嚴重後果: 讓感染者以為安全而繼續趴趴走,造成疫情擴散,這就是「錯失成本」。

二、 精確率 vs. 召回率:篩檢策略的兩難

身為 AI 應用規劃師,您必須根據業務目標(例如防疫策略),決定您的篩檢模型(AI)應該「追求精準」還是「追求全面」:

1. 精確率 (Precision):追求品質,避免誤殺 (FP)

  • 白話問句:「在所有被快篩喊『陽性』的人中,到底有多少比例是真的感染者?」
  • 應用場景:核酸檢測(PCR)。由於 PCR 結果會導致嚴格的隔離與治療,我們必須確保被判定為陽性的人是極度精準的,寧可犧牲一些速度,也要降低誤判。

2. 召回率 (Recall):追求全面,避免漏放 (FN)

  • 白話問句:「在所有『真正已感染』的人中,快篩成功找出了多少比例?」
  • 應用場景:大規模快篩普篩。在疫情爆發初期,目標是儘快找出所有潛在感染者,避免任何遺漏。這時會優先追求高召回率,寧可多抓一些偽陽性(FP),也不能放過任何一個已感染者(FN)。

記住,這兩者是蹺蹺板的兩端,您的防疫或商業目標,決定了您該優先追求哪一個指標。


下集預告:高準確率背後的陷阱!

當資料極度不平衡時,例如全國 99.9% 的人都是陰性,此時一個「永遠猜陰性」的模型也能達到 99.9% 的準確度,但它根本抓不到任何病人!

在我的Youtube頻道[統計分析2] 讓人混淆的混淆矩陣、精確率與召回率這個影片中,將揭露 「準確度悖論」,並介紹更可靠的 PR 曲線,帶你看清如何看清AI的真正實力。

歡迎訂閱我的YouTube頻道與方格子,用最高效的方式一起學習!

留言
avatar-img
留言分享你的想法!
avatar-img
iPAS AI 自學路
1會員
23內容數
我是一位正在追求職涯升級的 40 歲非本科系上班族。我會將自己摸索出的高效白話筆記與聽覺學習法無私分享,助你:克服術語障礙、利用零碎時間學習、系統化整理考點。 也歡迎到我的頻道逛逛https://www.youtube.com/@ipasstudybuddy
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News