评价指标F-Measure

衡量二分类模型精度的一种指标,兼顾了分类模型的精确率(precision)和召回率(recall)。是精确率和召回率的调和平均数,最大为 1,最小为 0

precision & recall

二分类问题分类的结果有下面的几种情况:

预测\真实 正例 反例
正例 预测正确(True Positive 错误的将其他类预测为本类(False Positive
反例 本类标签预测成其他类(False Nagtive 预测反例正确(True Negative

上面的各种预测情况可以简写成

\[TP+FP+TN+FN = 样例总数 \]

有两个重要的衡量指标,分别是:

  1. precision:又叫精准度/查准度,指分类器预测为正例中分类正确的比例

\[{precision}_{k} = \frac{TP}{TP + FP} \]

  1. recall:召回率/查全率,被预测为正例的样本占真实正例的比重

\[\text{recall} = \frac{TP}{TP+FN} \]

  1. accuracy

\[\text{accuracy} = \frac{预测正确数量}{样本总数量} = \frac{TP+TN}{TP+TN+FP+FN} \]

为什么需要 F-Measure

一般来说,查准率高是,查全率往往偏低;而查全率高时,查准率往往偏低(要使查准率高,最容易的事情就是将所有的样本都判定为正类,那就会误报很多)。\(F-Measure\) 可以在查准率和查全率之间取得一个平衡。

\[F_{\beta} = (1+\beta) \cdot \frac{precision \cdot recall}{\beta^2 precision + recall} \]

\(\beta\) 代表 precision 的重要程度是 recall 的 \(\beta\) 倍。

\(\beta = 1\) 时,就得到了 \(F_{1}\)

\[F_{1}=2\cdot\frac{p r e cisi o n\cdot r e c a l l}{p r e cisi o n+r e c a l l} \]

应用

  • [[IMDL中的F-Measure]]

参考资料

posted @ 2024-08-15 18:22  Kelfvin  阅读(136)  评论(0)    收藏  举报