理解精确率(precision)、准确率(accuracy)和召回率(recall)
正样本 | 负样本 | |
---|---|---|
预测正例 | TP | FP |
预测反例 | FN | TN |
TN,预测是负样本,预测对了
FP,预测是正样本,预测错了
FN,预测是负样本,预测错了
TP,预测是正样本,预测对了
精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是
大白话就是“ 你预测为正例的里面有多少是对的”
而召回率是针对我们原来的正样本而言的,它表示的是正例样本中有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。
大白话就是“正例样本里你的预测覆盖了多少”
准确率是针对我们原来所有样本而言的,它表示的是所有样本有多少被准确预测了
R=(TP TN)/(TP TN FP FN)
在信息检索领域,精确率和召回率又被称为查准率和查全率,
查准率=检索出的相关信息量 / 检索出的信息总量
查全率=检索出的相关信息量 / 系统中的相关信息总量