分類與 Confusion Matrix(必考)

一句話理解

要取哪個 Confusion Matrix 數值作為結果,取決於「哪種錯誤的代價更高」。

⚠️ 必考重點

要取 Confusion Matrix 哪個數值作為結果是需要討論的!

Confusion Matrix 範例

以辨識四個科系(工管、設計、電機、應外)為例,整體準確率:93%

三個討論問題

討論問題對應指標
討論1如果是要判斷辨識能力?整體 Accuracy
討論2如果是要判斷工管系學生被辨識出的容易程度?Recall(召回率)
討論3一個學生被說是電機學生,一定是對的嗎?Precision(精確率)

⚠️ 陷阱:總辨識率不一定是最好

情境:兩種快篩試紙的癌症辨識結果

試紙 A(總辨識率 75%)

  • 癌症 Recall:100%(不漏診任何癌症)
  • 偽陽性:50 人(誤診率高)

試紙 B(總辨識率 95%)

  • 總辨識率高,偽陽性為 0
  • 但有 10 例癌症被漏診(偽陰性)

分析比較

指標試紙 A試紙 B
總辨識率75%95%
癌症 Recall100%90%
偽陰性(漏診癌症)0 人10 人
偽陽性(誤診為癌症)50 人0 人

關鍵觀念

要選哪個指標,取決於「哪種錯誤的代價更高」

  • 癌症篩檢 → 漏診代價遠大於誤診 → 優先看 Recall(召回率)
  • 不同場景要選不同指標,不能只看 Accuracy!

MMSAI2 | AI演算法分類 | 分群與輪廓係數