评价指标F-Measure

衡量二分类模型精度的一种指标，兼顾了分类模型的精确率（precision）和召回率（recall）。是精确率和召回率的调和平均数，最大为 1，最小为 0

precision & recall

二分类问题分类的结果有下面的几种情况：

预测\真实	正例	反例
正例	预测正确（True Positive）	错误的将其他类预测为本类（False Positive）
反例	本类标签预测成其他类（False Nagtive）	预测反例正确（True Negative）

上面的各种预测情况可以简写成

\[TP+FP+TN+FN = 样例总数 \]

有两个重要的衡量指标，分别是：

\[{precision}_{k} = \frac{TP}{TP + FP} \]

\[\text{recall} = \frac{TP}{TP+FN} \]

\[\text{accuracy} = \frac{预测正确数量}{样本总数量} = \frac{TP+TN}{TP+TN+FP+FN} \]

一般来说，查准率高是，查全率往往偏低；而查全率高时，查准率往往偏低（要使查准率高，最容易的事情就是将所有的样本都判定为正类，那就会误报很多）。\(F-Measure\) 可以在查准率和查全率之间取得一个平衡。

\[F_{\beta} = (1+\beta) \cdot \frac{precision \cdot recall}{\beta^2 precision + recall} \]

\(\beta\) 代表 precision 的重要程度是 recall 的 \(\beta\) 倍。

当 \(\beta = 1\) 时，就得到了 \(F_{1}\)。

\[F_{1}=2\cdot\frac{p r e cisi o n\cdot r e c a l l}{p r e cisi o n+r e c a l l} \]

posted @ 2024-08-15 18:22 Kelfvin 阅读(136) 评论(0) 收藏举报

刷新页面返回顶部