從最難懂的痛點開始
我是「iPAS AI 自學路」的創辦人。身為一位非資訊本科系的 40 歲中年上班族,我深知在零碎時間內,要理解iPAS證照那些艱澀的統計名詞有多痛苦。因此,我決定從我最難懂的主題——混淆矩陣和精確率/召回率開始,用最白話的方式為你「翻譯」AI 決策的核心。
我們就用大家最熟悉的COVID-19快篩,來當作我們評估的AI模型。
一、 混淆矩陣:快篩結果的四種情境
我們不能只看快篩的「總分」(準確度),必須知道它「錯在哪裡」。混淆矩陣(Confusion Matrix)就是這份篩檢結果的診斷報告,將判斷結果分成兩大類共四種情境:
✅ 正確的結果(快篩判斷正確!)
- TP (真陽性): 抓對了!(神準)實際已感染,快篩結果為陽性。
- TN (真陰性): 排除了!(安全)實際未感染,快篩結果為陰性。
❌ 錯誤的結果(快篩搞混了!)
- FP (偽陽性): 誤殺了!(虛驚一場)實際未感染,但快篩卻呈現陽性。後果是造成不必要的隔離、PCR資源浪費,這就是「誤判成本」。
- FN (偽陰性): 漏掉了!(潛在危機)實際已感染,但快篩卻呈現陰性。嚴重後果: 讓感染者以為安全而繼續趴趴走,造成疫情擴散,這就是「錯失成本」。
二、 精確率 vs. 召回率:篩檢策略的兩難
身為 AI 應用規劃師,您必須根據業務目標(例如防疫策略),決定您的篩檢模型(AI)應該「追求精準」還是「追求全面」:
1. 精確率 (Precision):追求品質,避免誤殺 (FP)
- 白話問句:「在所有被快篩喊『陽性』的人中,到底有多少比例是真的感染者?」
- 應用場景:核酸檢測(PCR)。由於 PCR 結果會導致嚴格的隔離與治療,我們必須確保被判定為陽性的人是極度精準的,寧可犧牲一些速度,也要降低誤判。
2. 召回率 (Recall):追求全面,避免漏放 (FN)
- 白話問句:「在所有『真正已感染』的人中,快篩成功找出了多少比例?」
- 應用場景:大規模快篩普篩。在疫情爆發初期,目標是儘快找出所有潛在感染者,避免任何遺漏。這時會優先追求高召回率,寧可多抓一些偽陽性(FP),也不能放過任何一個已感染者(FN)。
記住,這兩者是蹺蹺板的兩端,您的防疫或商業目標,決定了您該優先追求哪一個指標。
下集預告:高準確率背後的陷阱!
當資料極度不平衡時,例如全國 99.9% 的人都是陰性,此時一個「永遠猜陰性」的模型也能達到 99.9% 的準確度,但它根本抓不到任何病人!
在我的Youtube頻道[統計分析2] 讓人混淆的混淆矩陣、精確率與召回率這個影片中,將揭露 「準確度悖論」,並介紹更可靠的 PR 曲線,帶你看清如何看清AI的真正實力。
歡迎訂閱我的YouTube頻道與方格子,用最高效的方式一起學習!














