随笔分类 - 机器学习
摘要:一、AUC含义 AUC是二分类指标ROC曲线下方的面积,在0~1之间。而在预测结果概率列表中可以理解为负样本排在正样本前面的概率(对概率值列排序)。 二、概率列表 通常建模结果可以输出为包含两列的表,第一列为真实标签(1/0),第二列为预测标签1的概率,示例如下: 三、利用awk计算AUC (1)先
阅读全文
摘要:1.数据归一化的目的 数据归一化的目的,就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用。 2.数据归一化的方式 (1)最值归一化 特点: 可以将所有数据都映射到0-1之间,它适用于数据分布有明显边界的情况,容易受到异常值的影响,异常值会造成数据的整体偏
阅读全文
摘要:一、首先了解混淆矩阵中的四个值对应的意思: True Positive(真正,TP):将正类预测为正类数 True Negative(真负,TN):将负类预测为负类数 False Positive(假正,FP):将负类预测为正类数误报 (Type I error) False Negative(假负
阅读全文
浙公网安备 33010602011771号