【混淆矩陣】為什麼準確率高,模型卻一團亂?用快篩案例秒懂混淆矩陣、精確率與召回率!

更新 發佈閱讀 3 分鐘

從最難懂的痛點開始

我是「iPAS AI 自學路」的創辦人。身為一位非資訊本科系40 歲中年上班族,我深知在零碎時間內,要理解iPAS證照那些艱澀的統計名詞有多痛苦。因此,我決定從我最難懂的主題——混淆矩陣精確率/召回率開始,用最白話的方式為你「翻譯」AI 決策的核心。

我們就用大家最熟悉的COVID-19快篩,來當作我們評估的AI模型。



一、 混淆矩陣:快篩結果的四種情境

我們不能只看快篩的「總分」(準確度),必須知道它「錯在哪裡」。混淆矩陣(Confusion Matrix)就是這份篩檢結果的診斷報告,將判斷結果分成兩大類共四種情境:

✅ 正確的結果(快篩判斷正確!)

  1. TP (真陽性): 抓對了!(神準)實際已感染,快篩結果為陽性。
  2. TN (真陰性): 排除了!(安全)實際未感染,快篩結果為陰性。

❌ 錯誤的結果(快篩搞混了!)

  1. FP (偽陽性): 誤殺了!(虛驚一場)實際未感染,但快篩卻呈現陽性。後果是造成不必要的隔離、PCR資源浪費,這就是「誤判成本」。
  2. FN (偽陰性): 漏掉了!(潛在危機)實際已感染,但快篩卻呈現陰性。嚴重後果: 讓感染者以為安全而繼續趴趴走,造成疫情擴散,這就是「錯失成本」。

二、 精確率 vs. 召回率:篩檢策略的兩難

身為 AI 應用規劃師,您必須根據業務目標(例如防疫策略),決定您的篩檢模型(AI)應該「追求精準」還是「追求全面」:

1. 精確率 (Precision):追求品質,避免誤殺 (FP)

  • 白話問句:「在所有被快篩喊『陽性』的人中,到底有多少比例是真的感染者?」
  • 應用場景:核酸檢測(PCR)。由於 PCR 結果會導致嚴格的隔離與治療,我們必須確保被判定為陽性的人是極度精準的,寧可犧牲一些速度,也要降低誤判。

2. 召回率 (Recall):追求全面,避免漏放 (FN)

  • 白話問句:「在所有『真正已感染』的人中,快篩成功找出了多少比例?」
  • 應用場景:大規模快篩普篩。在疫情爆發初期,目標是儘快找出所有潛在感染者,避免任何遺漏。這時會優先追求高召回率,寧可多抓一些偽陽性(FP),也不能放過任何一個已感染者(FN)。

記住,這兩者是蹺蹺板的兩端,您的防疫或商業目標,決定了您該優先追求哪一個指標。


下集預告:高準確率背後的陷阱!

當資料極度不平衡時,例如全國 99.9% 的人都是陰性,此時一個「永遠猜陰性」的模型也能達到 99.9% 的準確度,但它根本抓不到任何病人!

在我的Youtube頻道[統計分析2] 讓人混淆的混淆矩陣、精確率與召回率這個影片中,將揭露 「準確度悖論」,並介紹更可靠的 PR 曲線,帶你看清如何看清AI的真正實力。

歡迎訂閱我的YouTube頻道與方格子,用最高效的方式一起學習!

留言
avatar-img
iPAS自學路|備考軍火庫 & 白話筆記
194會員
63內容數
40 歲、非本科、iPAS AI 應用規劃師「初/中級雙證」持有。 這裡不談艱澀理論,只有實戰派的「備考軍火庫」。 1️⃣ 白話考點解析:把硬核技術變成人話。 2️⃣ 考前速記表:精準過濾資訊,只留重點。 3️⃣ 碎時高效得分:搭配頻道服用,通勤即超車。 讓 AI 證照成為你職場下半場的救命裝備。
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News