F1分数

分类的常用指标有：

accuracy：准确率

recall：召回率

precison：精确率

f1score：f1分数，是recall和precison的调和均值。

准确率什么情况下失效？

在正负样本不均衡的情况下，accuracy这个指标有很大的缺陷。

如：正样本990个，负样本10个。

这样好像也没有什么用处哦？

原因是关注正样本还是负样本。

默认是关注正样本，而此时的正样本太多，就算混入几个副样本也无伤大雅。

但大部分情况下是那10个才叫“正样本”,比如异常检测里，990个正常，10个异常，我们可能会更关注那10个异常。这10个异常叫做正样本。

此时就有 10 个正样本，990个负样本。

此时的准确率是多少呢？

几个指标的通俗说明

recall:召回率，也叫查全率。其实就是

在上面的例子中，原本正样本990个负样本10个。预测结果为：1000个正样本。

怎么计算召回率呢?

召回率 = 预测对的所有正例 / 原本的所有正例

当然查的越全越好，查的越准也越好。但一般情况下，这两个值是“此消彼长”的关系。所以就要有Fscore了，Fscore是R、P的调和均值，也是越大越好。一般用F1_score

posted on 2020-08-24 10:43 滚雪球效应阅读(2153) 评论(0) 收藏举报