准确率和召回率（错了，待修改）

总感觉直接求正确率就够了。

对于检索问题，召回率很容易理解：

对于分类问题，总感觉有点怪异：

看看这些比喻，也许有些形象：http://www.zhihu.com/question/19645541

这个好：

好吧，让我们看看一下三幅图，来说明一下折中问题：（我的想法）

图1：作为参照，准确率为80/（80+5）=94.1%，（右的5），召回率为80/（80+5）=94.1%

图2：想增强实际正例判为正例的概率，那么希望调整某些参数，使得如下图第一行。可是，通常，对于不够强大的分类器而言，会导致原来负例判为负例的情况也倾向判为正例，即第二行。即分类器趋向于分成正例了，这是我们不想看到的。

图3：和图2相反，想增强实际负例判为负例的概率，那么希望调整某些参数，使得如下图第一行。可是，通常，对于不够强大的分类器而言，会导致原来正例判为正例的情况也倾向判为负例，即第二行。即分类器趋向于分成负例了，这是我们不想看到的。

怎么画：

那么，如何画PR曲线呢？

通过设置不同的阈值。譬如，一种可能的做法是，根据得分判断两类，得分范围为low~high,那么，在low~high之间一系列值，然后求得不同的准确率和召回率，进而画出P-R曲线。

posted on 2016-01-26 15:25 一动不动的葱头阅读(1352) 评论(0) 收藏举报

刷新页面返回顶部

一动不动的葱头