标准化和正则化

在机器学习和数据分析中,不同的特征属性的性质、量纲、数量级都是不同。在数值上相差很大,所以在数据预处理的过程中应该将数据进行标准化操作,是的各个特征的量纲处于同一水平。

常见的数据标准化方法有  

1.极差标准化

  x' = x - x(min)/ x(max)-x(min)

0=<x'=<1

 

2.Z-score 标准化

当数据的最大值和最小值未知,或者最大最小值超过取值范围为异常值时,就不能再用极差进行标准化。可用Z-score标准化,也是常用标准化方法之一。

x' = x - x(mean)  /  std

std是标准差,经过Z-score标准化后,数据的均值变为0,标准差变为1.

 

3.对数函数标准化

4.反正切函数标准化

posted @ 2021-07-22 17:11  键盘上的优雅  阅读(399)  评论(0)    收藏  举报