Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);true positives;false positives;false negatives.

Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);在信息检索(如搜索引擎)、自然语言处理和检测分类中经常会使用这些参数。

Precision:被检测出来的信息当中正确的或者相关的(也就是你想要的)信息中所占的比例(TP占预测总正样本的比例)
Recall:所有正确的信息或者相关的信息(wanted)被检测出来的比例(TP占真实总正样本数的比例)
 
 
表格中的翻译比较重要,可以帮助理解。
true positives (纳真)                     false positives(纳伪)=误报
false negatives(去真)=漏报       true negatives  (去伪)
其中false positives(纳伪)也通常称作误报,false negatives也通常称作漏报!
Precision =  tp/(tp + fp);
Recall = tp / (tp + fn).
同样还有另外两个定义:
    \mbox{True Negative Rate}=\frac{tn}{tn+fp} \,
    \mbox{Accuracy}=\frac{tp+tn}{tp+tn+fp+fn} \,
 
然而在实际当中我们当然希望检索的结果P越高越好,R也越高越好;事实上这两者在某些情况下是矛盾的。比如,我们只搜出了一个结果,且是准确的,那么P就是100%,但是R就很低;而如果我们把所有结果都返回,那么必然R是100%,但是P很低。因此在不同的场合中需要自己判断希望P比较高还是R比较高。如果是做实验,可以绘制Precision-Recall曲线来帮助分析。
 
F-Measure是Precision和Recall加权调和平均:

 F = \frac{(a^2+1)P*R} {a^2(P+R)} \hfill (3)

当参数a=1时,就是最常见的F1了:
 F1 = \frac{2PR} {P+R} \hfill (4)

很容易理解,F1综合了P和R的结果,当F1较高时则比较说明实验方法比较理想。

 

posted @ 2016-04-06 22:28  hudongni1  阅读(514)  评论(0编辑  收藏  举报