【混淆矩陣】為什麼準確率高,模型卻一團亂?用快篩案例秒懂混淆矩陣、精確率與召回率!

更新 發佈閱讀 3 分鐘

從最難懂的痛點開始

我是「iPAS AI 自學路」的創辦人。身為一位非資訊本科系40 歲中年上班族,我深知在零碎時間內,要理解iPAS證照那些艱澀的統計名詞有多痛苦。因此,我決定從我最難懂的主題——混淆矩陣精確率/召回率開始,用最白話的方式為你「翻譯」AI 決策的核心。

我們就用大家最熟悉的COVID-19快篩,來當作我們評估的AI模型。



一、 混淆矩陣:快篩結果的四種情境

我們不能只看快篩的「總分」(準確度),必須知道它「錯在哪裡」。混淆矩陣(Confusion Matrix)就是這份篩檢結果的診斷報告,將判斷結果分成兩大類共四種情境:

✅ 正確的結果(快篩判斷正確!)

  1. TP (真陽性): 抓對了!(神準)實際已感染,快篩結果為陽性。
  2. TN (真陰性): 排除了!(安全)實際未感染,快篩結果為陰性。

❌ 錯誤的結果(快篩搞混了!)

  1. FP (偽陽性): 誤殺了!(虛驚一場)實際未感染,但快篩卻呈現陽性。後果是造成不必要的隔離、PCR資源浪費,這就是「誤判成本」。
  2. FN (偽陰性): 漏掉了!(潛在危機)實際已感染,但快篩卻呈現陰性。嚴重後果: 讓感染者以為安全而繼續趴趴走,造成疫情擴散,這就是「錯失成本」。

二、 精確率 vs. 召回率:篩檢策略的兩難

身為 AI 應用規劃師,您必須根據業務目標(例如防疫策略),決定您的篩檢模型(AI)應該「追求精準」還是「追求全面」:

1. 精確率 (Precision):追求品質,避免誤殺 (FP)

  • 白話問句:「在所有被快篩喊『陽性』的人中,到底有多少比例是真的感染者?」
  • 應用場景:核酸檢測(PCR)。由於 PCR 結果會導致嚴格的隔離與治療,我們必須確保被判定為陽性的人是極度精準的,寧可犧牲一些速度,也要降低誤判。

2. 召回率 (Recall):追求全面,避免漏放 (FN)

  • 白話問句:「在所有『真正已感染』的人中,快篩成功找出了多少比例?」
  • 應用場景:大規模快篩普篩。在疫情爆發初期,目標是儘快找出所有潛在感染者,避免任何遺漏。這時會優先追求高召回率,寧可多抓一些偽陽性(FP),也不能放過任何一個已感染者(FN)。

記住,這兩者是蹺蹺板的兩端,您的防疫或商業目標,決定了您該優先追求哪一個指標。


下集預告:高準確率背後的陷阱!

當資料極度不平衡時,例如全國 99.9% 的人都是陰性,此時一個「永遠猜陰性」的模型也能達到 99.9% 的準確度,但它根本抓不到任何病人!

在我的Youtube頻道[統計分析2] 讓人混淆的混淆矩陣、精確率與召回率這個影片中,將揭露 「準確度悖論」,並介紹更可靠的 PR 曲線,帶你看清如何看清AI的真正實力。

歡迎訂閱我的YouTube頻道與方格子,用最高效的方式一起學習!

留言
avatar-img
iPAS自學路|備考軍火庫 & 白話筆記
268會員
73內容數
40 歲、非本科、iPAS AI 應用規劃師「初/中級雙證」持有。 這裡不談艱澀理論,只有實戰派的「備考軍火庫」。 1️⃣ 白話考點解析:把硬核技術變成人話。 2️⃣ 考前速記表:精準過濾資訊,只留重點。 3️⃣ 碎時高效得分:搭配頻道服用,通勤即超車。 讓 AI 證照成為你職場下半場的救命裝備。
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News