摘要: 1.混淆矩阵(confusion matrix) 针对预测值和真实值之间的关系,我们可以将样本分为四个部分,分别是: 真正例(True Positive,TP):预测值和真实值都为1 假正例(False Positive,FP):预测值为1,真实值为0 真负例(True Negative,TN):预测值与真实值都为0 假负例(False Negat... 阅读全文
posted @ 2013-12-12 16:51 Dengchao 阅读(12878) 评论(0) 推荐(0) 编辑
摘要: 假正例(False Positive):预测为1,实际为0的样本 假负例(False Negative):预测为0,实际为1的样本 实际预测中,那些真正例(True Positive)和真负例(True Negative)都不会造成损失(cost)。 那么,我们假设一个假正例的损失是LFP,一个假负例的损失是LFN。 我们可以得到一个损失矩阵: ... 阅读全文
posted @ 2013-12-12 15:36 Dengchao 阅读(1173) 评论(0) 推荐(0) 编辑
摘要: 一、无序结果评价 1.正确率(Precision) 可以看到,准确率的范围是在[0,1],准确率反应了系统返回的文档中,真正相关的文档占的比例。 2.召回率(Recall) 召回率的返回也是[0,1],召回率反应了系统对于那些真正相关的文档,有多少被返回了。 召回率和准确率如果都很高,说明检索系统的结果很不错哦,但是二者很难兼得,试想,如果我讲所有的候选文档全部返回,那必然就返回... 阅读全文
posted @ 2013-11-29 12:16 Dengchao 阅读(1676) 评论(0) 推荐(0) 编辑