分類與 Confusion Matrix(必考)
一句話理解
要取哪個 Confusion Matrix 數值作為結果,取決於「哪種錯誤的代價更高」。
⚠️ 必考重點
要取 Confusion Matrix 哪個數值作為結果是需要討論的!
Confusion Matrix 範例
以辨識四個科系(工管、設計、電機、應外)為例,整體準確率:93%
三個討論問題
| 討論 | 問題 | 對應指標 |
|---|---|---|
| 討論1 | 如果是要判斷辨識能力? | 整體 Accuracy |
| 討論2 | 如果是要判斷工管系學生被辨識出的容易程度? | Recall(召回率) |
| 討論3 | 一個學生被說是電機學生,一定是對的嗎? | Precision(精確率) |
⚠️ 陷阱:總辨識率不一定是最好
情境:兩種快篩試紙的癌症辨識結果
試紙 A(總辨識率 75%)
- 癌症 Recall:100%(不漏診任何癌症)
- 偽陽性:50 人(誤診率高)
試紙 B(總辨識率 95%)
- 總辨識率高,偽陽性為 0
- 但有 10 例癌症被漏診(偽陰性)
分析比較
| 指標 | 試紙 A | 試紙 B |
|---|---|---|
| 總辨識率 | 75% | 95% |
| 癌症 Recall | 100% | 90% |
| 偽陰性(漏診癌症) | 0 人 | 10 人 |
| 偽陽性(誤診為癌症) | 50 人 | 0 人 |
關鍵觀念
要選哪個指標,取決於「哪種錯誤的代價更高」
- 癌症篩檢 → 漏診代價遠大於誤診 → 優先看 Recall(召回率)
- 不同場景要選不同指標,不能只看 Accuracy!