混淆矩陣怎么看?準(zhǔn)確率、精確率、召回率
混淆矩陣(Confusion Matrix)是用于評(píng)估分類模型性能的一種常用工具。它是一個(gè)二維矩陣,用于展示模型在不同類別上的分類結(jié)果。
混淆矩陣的行表示實(shí)際的類別,列表示模型預(yù)測(cè)的類別。矩陣的每個(gè)元素表示模型將樣本分為某個(gè)實(shí)際類別和某個(gè)預(yù)測(cè)類別的數(shù)量。
混淆矩陣的四個(gè)基本指標(biāo)如下:
1. 真正例(True Positive, TP):模型正確地將正例樣本預(yù)測(cè)為正例的數(shù)量。
2. 假正例(False Positive, FP):模型錯(cuò)誤地將負(fù)例樣本預(yù)測(cè)為正例的數(shù)量。
3. 假反例(False Negative, FN):模型錯(cuò)誤地將正例樣本預(yù)測(cè)為負(fù)例的數(shù)量。
4. 真反例(True Negative, TN):模型正確地將負(fù)例樣本預(yù)測(cè)為負(fù)例的數(shù)量。
根據(jù)混淆矩陣的這四個(gè)指標(biāo),可以計(jì)算出一些常用的分類性能指標(biāo):
1. 準(zhǔn)確率(Accuracy):模型正確預(yù)測(cè)的樣本數(shù)量占總樣本數(shù)量的比例,計(jì)算公式為 (TP + TN) / (TP + FP + FN + TN)。
2. 精確率(Precision):模型正確預(yù)測(cè)為正例的樣本數(shù)量占所有預(yù)測(cè)為正例的樣本數(shù)量的比例,計(jì)算公式為 TP / (TP + FP)。
3. 召回率(Recall):模型正確預(yù)測(cè)為正例的樣本數(shù)量占所有實(shí)際為正例的樣本數(shù)量的比例,計(jì)算公式為 TP / (TP + FN)。
4. F1值(F1-score):綜合考慮了精確率和召回率的指標(biāo),計(jì)算公式為 2 * (Precision * Recall) / (Precision + Recall)。
通過觀察混淆矩陣,可以直觀地了解模型在不同類別上的分類情況。
例如,可以通過查看矩陣的對(duì)角線元素來了解模型在每個(gè)類別上的準(zhǔn)確率;通過查看矩陣的非對(duì)角線元素來了解模型在不同類別之間的混淆情況。
混淆矩陣是一種直觀、簡(jiǎn)單且有效的評(píng)估分類模型性能的工具,通過分析混淆矩陣可以得到模型在不同類別上的分類情況,并計(jì)算出一些常用的分類性能指標(biāo)。
【此文由“青象信息老向”原創(chuàng),轉(zhuǎn)載需備注來源和出處】