搞懂真陽性、假陽性:用混淆矩陣(Confusion Matrix)破解留存率的秘密

更新於 發佈於 閱讀時間約 7 分鐘

數據拆解用戶「留下來」的真相

身為產品經理或數據分析師,你一定常常盯著後台的留存率,心想:「到底是誰偷走了我的用戶?」其實,留存率就像感情一樣,外表看起來一切順利,但裡頭可能暗藏許多小問題。這時候,「混淆矩陣(Confusion Matrix)」就像是情感專家,可以告訴我們到底誰是真心,誰只是在曖昧。

別被混淆矩陣這個名字嚇到,它其實是一個簡單又好用的工具,能幫助我們更清楚地分類和分析用戶行為。接下來就讓我用最接地氣的方式帶你快速掌握!

入門解析:混淆矩陣的四大分類

什麼是混淆矩陣?

簡單來說,混淆矩陣是一種評估「分類預測準確度」的工具,能幫助我們比較「系統的預測」和「實際結果」之間的差異。舉個例子,假設我們預測某位用戶會留下來,混淆矩陣可以幫助我們檢視這個預測到底準不準,進而分析產品的影響力。

混淆矩陣的四大情境

當我們將「預測結果」與「實際行為」交叉比對後,會出現四種情況:

真陽性(True Positive, TP):預測用戶會留下,而且他真的留下了,這是我們最愛看到的。

假陽性(False Positive, FP):預測用戶會留下,但他卻默默消失,這表示可能我們看錯了某些訊號。

真陰性(True Negative, TN):預測用戶會離開,他也真的離開了,代表我們的分析非常到位。

假陰性(False Negative, FN):預測用戶會離開,但他反而繼續使用,這類用戶可能有特別原因留下來,需要額外研究一下。

透過這四個分類,我們能更清楚地知道產品哪些地方做對了,哪些地方需要優化。


了解四大指標,避免掉入預測陷阱!

混淆矩陣除了幫助我們拆解用戶行為,還有幾個關鍵數據指標,能進一步衡量模型的準確性:

  • 陽性預測值(PPV, Positive Predictive Value):當系統預測某人會留下來,實際留下的比例是多少?這決定了我們的標準是否足夠準確。
  • 陰性預測值(NPV, Negative Predictive Value):當系統預測某人會流失,他真的離開的機率有多高?這能反映我們對流失行為的判斷是否正確。
  • 靈敏度(Sensitivity):在所有真正留下的用戶中,系統能成功預測的比例是多少?數值越高,代表我們的模型越能捕捉留下來的用戶。
  • 特異度(Specificity):在所有真正流失的用戶中,系統能成功預測的比例是多少?能確保我們不誤判那些確實會離開的用戶。

這些指標的平衡對優化留存策略至關重要,能避免模型過度偏向某一邊,導致錯誤決策。

範例解析:從數據看留存預測的準確性

raw-image

上方這張表格顯示的是 某事件的發生頻率用戶留存情況 的關係。其中數據的排列方式為:

  • 左上角(True Positive, TP):14 位用戶事件發生次數 ≥10 次,且成功留存。
  • 右上角(False Positive, FP):1 位用戶事件發生次數 ≥10 次,但未留存(錯誤預測)。
  • 左下角(False Negative, FN):30 位用戶事件發生次數 <10 次,但仍然留存(錯失預測)。
  • 右下角(True Negative, TN):46 位用戶事件發生次數 <10 次,且確實未留存。

PPV 高、Sensitivity 低

  • 數據解讀
    • PPV(陽性預測值)= TP / (TP + FP) = 14 / (14 + 1) = 93.3%,這代表當系統預測「事件 ≥10 次的用戶會留下來」時,93.3% 的情況是正確的,也就是這個標準的準確度很高。
    • Sensitivity(靈敏度)= TP / (TP + FN) = 14 / (14 + 30) = 31.8%,但靈敏度很低,代表在所有真正留存的用戶中,系統只抓到了 31.8%,還有大量用戶(30 位)沒有達到「10 次」的標準,卻仍然成功留存(False Negative)。
  • 結論與建議

這類事件具備高 PPV,但 Sensitivity 低,代表它是一個較準確的預測指標,但可能太嚴格,導致許多潛在留存用戶被忽略。

👉 優化策略:可以嘗試降低門檻,例如改為「≥ 8 次」來提高 Sensitivity,進一步觀察是否能捕捉到更多潛在留存用戶。

NPV 高、Specificity 低

  • 數據解讀
    • NPV(陰性預測值)= TN / (TN + FN) = 46 / (46 + 30) = 60.5%,這代表當系統預測「事件發生次數 <10 次的用戶會流失」時,準確率為 60.5%,並不算特別高。
    • Specificity(特異度)= TN / (TN + FP) = 46 / (46 + 1) = 97.9%,特異度很高,代表系統在判定「哪些用戶不會留下來」時 極為準確
  • 結論與建議

這類事件在「排除無效用戶」方面表現不錯,但因為 NPV 只有 60.5%,表示「事件 <10 次」的用戶中,仍有相當一部分人會留下來(False Negative 高)

👉 優化策略:可嘗試結合其他行為數據(例如「互動時長」或「社交參與度」),以降低 False Negative,提升預測準確性。

小心這些混淆矩陣的常見誤區

就算掌握了混淆矩陣的分類與指標,也可能在實際應用時踩到陷阱,造成誤判與錯誤決策。以下是幾個常見的問題與解方:

  1. 相關性 ≠ 因果關係:混淆矩陣能找出相關性,但不代表就一定是因果關係,務必要透過實驗(如 A/B 測試)來進一步驗證。
  2. 忽略樣本量限制:如果樣本量太少,指標計算會失真,容易導致錯誤推論。建議在分析前先評估樣本數是否足以支撐結論,並在可能的範圍內擴大數據收集。
  3. 只關注單一象限:有時只想提升真陽性(TP)或降低假陰性(FN),卻忽視其他象限提供的重要線索。建議每個象限都要關注,特別是高假陽性與高假陰性的背後原因,可能蘊藏關鍵改善點。
  4. 門檻設定不合理:在門檻過高或過低的情況下,可能導致 Sensitivity、Specificity、PPV、NPV 等指標失衡,無法精準反映真實情況。可嘗試多次調整門檻,尋找平衡點。
  5. 追蹤週期過短或過長:若留存週期與使用者的自然行為週期不匹配,指標就會失真。務必根據產品特性和用戶行為模式,選擇合適的追蹤週期(例如 7 天、14 天或 30 天)。

結論:善用混淆矩陣,決勝留存策略

透過混淆矩陣,我們能更精準地分析和改善留存策略。從分類象限到PPV、NPV等指標,你可以找到各種潛在的優化點,避免資源浪費在無效的策略上。

無論你想改善用戶體驗、新手引導流程,還是推廣特定功能,混淆矩陣都能幫助你看清楚真正關鍵的行動方向,讓你更聰明地留住用戶。

今天就介紹到這邊,有任何疑問或想要討論的部分,都歡迎留言,讓我們一同成長!


參考資料:


留言
avatar-img
留言分享你的想法!
avatar-img
數位無罪,成長有理
33會員
30內容數
這不是冷冰冰的科技知識,而是一場 數據 × 生活 × 腦洞 的狂歡!我們專注於拆解那些讓人「哇靠!」的問題——AI 怎麼顛覆職場?熱門影視背後的商業套路?科技到底是助攻還是攪局?這裡不賣課、不端知識高冷范,我們用爆梗 + 數據思維,讓深奧的東西變得超接地氣又好玩!
2025/04/28
Inkuun團隊藉由一次行銷活動的低轉換率,深入檢討用戶獲取(Acquisition)策略,從數據分析中發現問題並提出解決方案,包括精準描繪理想用戶輪廓、優化新用戶導入流程、精算廣告預算效益、A/B測試素材與流程及建立可複製的成長模型,最終提升VIP訂閱率和用戶留存。
Thumbnail
2025/04/28
Inkuun團隊藉由一次行銷活動的低轉換率,深入檢討用戶獲取(Acquisition)策略,從數據分析中發現問題並提出解決方案,包括精準描繪理想用戶輪廓、優化新用戶導入流程、精算廣告預算效益、A/B測試素材與流程及建立可複製的成長模型,最終提升VIP訂閱率和用戶留存。
Thumbnail
2025/04/21
本文探討Inkuun漫畫創作平臺如何透過設計「創作者忠誠迴圈」,解決創作者流失問題,並提升平臺成長。文章以虛構故事呈現,描述團隊如何從數據分析中發現問題,設計六階段忠誠迴圈,並透過數據追蹤和誘因機制,提升創作者創作動力及留存率。
Thumbnail
2025/04/21
本文探討Inkuun漫畫創作平臺如何透過設計「創作者忠誠迴圈」,解決創作者流失問題,並提升平臺成長。文章以虛構故事呈現,描述團隊如何從數據分析中發現問題,設計六階段忠誠迴圈,並透過數據追蹤和誘因機制,提升創作者創作動力及留存率。
Thumbnail
2025/04/06
本文探討訂閱制平臺 MangaVerse 如何提升用戶留存率和轉換率,透過用戶生命週期分群模型、訂閱用戶追蹤系統及核心成長策略(提升轉換率、延長訂閱週期、降低獲客成本),打造穩定的營收飛輪,並預告下集將深入解析產品即行銷策略。
Thumbnail
2025/04/06
本文探討訂閱制平臺 MangaVerse 如何提升用戶留存率和轉換率,透過用戶生命週期分群模型、訂閱用戶追蹤系統及核心成長策略(提升轉換率、延長訂閱週期、降低獲客成本),打造穩定的營收飛輪,並預告下集將深入解析產品即行銷策略。
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
高中數學主題練習—兩向量夾角
Thumbnail
高中數學主題練習—兩向量夾角
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
高中數學主題練習—三點共線
Thumbnail
高中數學主題練習—三點共線
Thumbnail
高中數學主題練習—兩向量夾角
Thumbnail
高中數學主題練習—兩向量夾角
Thumbnail
演算法映射化簡的核心觀念 在面對新題目的時候,除了重頭想一個新的演算法之外; 還有另一個方法,想看看有沒有核心觀念彼此相同的問題與演算法, 如果有,就可以把新的題目映射化簡到已知解法的問題,用已知的演算法去解開。 接著,我們會介紹幾個範例,並且使用映射化簡的技巧來解題,透過化
Thumbnail
演算法映射化簡的核心觀念 在面對新題目的時候,除了重頭想一個新的演算法之外; 還有另一個方法,想看看有沒有核心觀念彼此相同的問題與演算法, 如果有,就可以把新的題目映射化簡到已知解法的問題,用已知的演算法去解開。 接著,我們會介紹幾個範例,並且使用映射化簡的技巧來解題,透過化
Thumbnail
有關於「清單煉金術(Goldlist Method)」記憶法的常見問答,可以更加瞭解這個記憶方法,消除對此記憶方法的使用疑惑。
Thumbnail
有關於「清單煉金術(Goldlist Method)」記憶法的常見問答,可以更加瞭解這個記憶方法,消除對此記憶方法的使用疑惑。
Thumbnail
日前在LINE社群,有網友提出一個問題,要把資料進行分析,用日期來計算出將對應的資料。 原始資料,密密麻麻的數據,都看不清楚了 放大一點點 要把這些資料不同『料號』的各種『狀態』依據『日期』進行分析。 有興趣可以下載試著挑戰看看:檔案下載 作法有很多種,當然也可以用函數處
Thumbnail
日前在LINE社群,有網友提出一個問題,要把資料進行分析,用日期來計算出將對應的資料。 原始資料,密密麻麻的數據,都看不清楚了 放大一點點 要把這些資料不同『料號』的各種『狀態』依據『日期』進行分析。 有興趣可以下載試著挑戰看看:檔案下載 作法有很多種,當然也可以用函數處
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News