准确率和召回率(错了,待修改)

总感觉直接求正确率就够了。

待修改时可参考:http://blog.sina.com.cn/s/blog_900690c60101czyo.html

http://blog.csdn.net/abcjennifer/article/details/7359370

对于检索问题,召回率很容易理解:

http://baike.baidu.com/link?url=QP9hWcZO8Jrumo8jLX4zaKt-Ol9-iEdBw7qhlAlociJ0uu7yPh07mXNavqO9b6GKQuJbtaid2kYmjx059_wzPq

对于分类问题,总感觉有点怪异:

看看这些比喻,也许有些形象:http://www.zhihu.com/question/19645541

这个全面一点:http://blog.sina.com.cn/s/blog_900690c60101czyo.html

这个好:

http://blog.csdn.net/marising/article/details/6543943#

http://www.360doc.com/content/14/0823/10/13518188_403996763.shtml

 

好吧,让我们看看一下三幅图,来说明一下折中问题:(我的想法)

图1:作为参照,准确率为80/(80+5)=94.1%,(右的5),召回率为80/(80+5)=94.1%

图2:想增强实际正例判为正例的概率,那么希望调整某些参数,使得如下图第一行。可是,通常,对于不够强大的分类器而言,会导致原来负例判为负例的情况也倾向判为正例,即第二行。即分类器趋向于分成正例了,这是我们不想看到的。

图3:和图2相反,想增强实际负例判为负例的概率,那么希望调整某些参数,使得如下图第一行。可是,通常,对于不够强大的分类器而言,会导致原来正例判为正例的情况也倾向判为负例,即第二行。即分类器趋向于分成负例了,这是我们不想看到的。

怎么画:

 那么,如何画PR曲线呢?

通过设置不同的阈值。譬如,一种可能的做法是,根据得分判断两类,得分范围为low~high,那么,在low~high之间一系列值,然后求得不同的准确率和召回率,进而画出P-R曲线。

posted on 2016-01-26 15:25  一动不动的葱头  阅读(1332)  评论(0编辑  收藏  举报

导航