归一化,标准化和中心化

https://www.zhihu.com/question/20467170
参考了知乎的回答,以及wiki的解释,个人的理解如下:
归一化和标准化本质上都是对数据集特征的缩放,而wiki的解释中特征的缩放一般有四种不同的公式

Rescaling (min-max normalization)

x'={\frac  {x-{\text{min}}(x)}{{\text{max}}(x)-{\text{min}}(x)}}

{\displaystyle x'=a+{\frac {(x-{\text{min}}(x))(b-a)}{{\text{max}}(x)-{\text{min}}(x)}}}

Mean normalization

{\displaystyle x'={\frac {x-{\text{average}}(x)}{{\text{max}}(x)-{\text{min}}(x)}}}

Standardization (Z-score Normalization)

x' = \frac{x - \bar{x}}{\sigma}

Scaling to unit length

{\displaystyle x'={\frac {x}{\left|{x}\right|_{2}}}}

归一化的一般方法就是上面公式中的第一个公式,而标准化的方法常用公式就是Z-score的方法,这两个方法都属于线性转换,都是按比例缩放,但是归一化还有其他方法,不一定是按比例缩放的,这样就会导致数据的分布不一样。

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">





posted @ 2019-07-04 16:11  raisok  阅读(684)  评论(0编辑  收藏  举报