#Header1_HeaderTitle{ font-size:50px }
摘要: 1. 常用的归一化。各自的作用 机器学习-数据归一化及哪些算法需要归一化 2. KMeans的步骤以及其他的聚类算法 K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算 其他聚类算法:二分K-均值 讲解一下步骤,其实就是说明一下伪代码 二分K-均值:(基于SSE的划分) 该 阅读全文
posted @ 2019-03-21 17:37 墨麟非攻 阅读(225) 评论(0) 推荐(0)
摘要: 一、什么是过拟合? 简单的说,就是对模型过度训练,把"训练数据学的太好了"。如下图所示: 通过上图可以看出,随着训练的进行,训练损失逐渐减小,而验证损失先降后升,此时便发生了过拟合。即模型的复杂度升高,但是泛化能力却降低。 降低过拟合的方法:数据集扩增(Data augmentation)、正则化( 阅读全文
posted @ 2019-03-21 17:36 墨麟非攻 阅读(829) 评论(0) 推荐(0)
摘要: 一、数据为什么需要归一化处理? 归一化的目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异对模型的影响。 方法: 1. 极差变换法 2. 0均值标准化(Z-score方法) 1. Max-Min(线性归一化) Max-Min归一化是对原始数据进行线性变化,利用 阅读全文
posted @ 2019-03-21 17:12 墨麟非攻 阅读(2541) 评论(0) 推荐(0)