机器学习 - 随笔分类 - 墨麟非攻

ROC与AUC

摘要：一、AUC AUC：随机挑选一个正样本和一个负样本，分类算法将这个正样本排在负样本前面的概率就是AUC。AUC越大，当前的分类算法越有可能将正样本排在负样本前面，即能够更好的分类。计算方法： 1、绘制ROC曲线，ROC曲线下的面积就是AUC的值 2. 假设总共有（m+n）个样本。其中正样本m个，负阅读全文

posted @ 2019-03-22 10:51 墨麟非攻阅读(359) 评论(0) 推荐(0)

如何防止过拟合

摘要：一、什么是过拟合？简单的说，就是对模型过度训练，把"训练数据学的太好了"。如下图所示：通过上图可以看出，随着训练的进行，训练损失逐渐减小，而验证损失先降后升，此时便发生了过拟合。即模型的复杂度升高，但是泛化能力却降低。降低过拟合的方法：数据集扩增（Data augmentation）、正则化（阅读全文

posted @ 2019-03-21 17:36 墨麟非攻阅读(837) 评论(0) 推荐(0)

机器学习-数据归一化及哪些算法需要归一化

摘要：一、数据为什么需要归一化处理？归一化的目的是处理不同规模和量纲的数据，使其缩放到相同的数据区间和范围，以减少规模、特征、分布差异对模型的影响。方法： 1. 极差变换法 2. 0均值标准化（Z-score方法） 1. Max-Min（线性归一化） Max-Min归一化是对原始数据进行线性变化，利用阅读全文

posted @ 2019-03-21 17:12 墨麟非攻阅读(2555) 评论(0) 推荐(0)

墨麟非攻

随笔分类 - 机器学习

公告