标准化和正则化
在机器学习和数据分析中,不同的特征属性的性质、量纲、数量级都是不同。在数值上相差很大,所以在数据预处理的过程中应该将数据进行标准化操作,是的各个特征的量纲处于同一水平。
常见的数据标准化方法有
1.极差标准化
x' = x - x(min)/ x(max)-x(min)
0=<x'=<1
2.Z-score 标准化
当数据的最大值和最小值未知,或者最大最小值超过取值范围为异常值时,就不能再用极差进行标准化。可用Z-score标准化,也是常用标准化方法之一。
x' = x - x(mean) / std
std是标准差,经过Z-score标准化后,数据的均值变为0,标准差变为1.
3.对数函数标准化
4.反正切函数标准化
浙公网安备 33010602011771号