AUC
一、ROC
首先,在试图弄懂AUC和ROC曲线之前,首先要彻底理解混淆矩阵的定义!
混淆矩阵中有着Positive、Negative、True、False的概念,其意义如下:
- 称预测类别为1的为Positive(阳性),预测类别为0的为Negative(阴性)。
- 预测正确的为True(真),预测错误的为False(伪)。
表示的意义是:对于不论真实类别是1还是0的样本,分类器预测为1的概率是相等的。
换句话说,分类器对于正例和负例毫无区分能力,和抛硬币没什么区别,一个抛硬币的分类器是我们能想象的最差的情况,因此一般来说我们认为AUC的最小值为0.5(当然也存在预测相反这种极端的情况,AUC小于0.5,这种情况相当于分类器总是把对的说成错的,错的认为是对的,那么只要把预测类别取反,便得到了一个AUC大于0.5的分类器)。
二、AUC
AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积。
fpr,tpr,threshold维数等于preds中唯一值数量确定。
参考:(52条消息) AUC原理详细讲解_晚睡的人没对象的博客-CSDN博客
(52条消息) 带你真正吃透AUC_auc曲线_OhMyJayce的博客-CSDN博客