特征去量纲方法

转自:https://www.jianshu.com/p/c21c0e2c403a

1.min-max归一化

针对每一个特征,最小-最大缩放:x-min/(max-min)

这样就缩放到了[0,1]之间,就会有一个范围,对应sklearn.preprcessing中的MinMaxScaler 。

2.z-score标准化

减去均值之后除以方差。

使得服从均值为0,方差为1的标准正态分布。对应sklearn.preprcessing中的StandardScaler :为使各特征的均值为0,方差为1.

3.Normalization

  • Normalizer :使每条数据各特征值的和为1

对每个特征的和归一化到一个特定的值。

4.PCA需要做什么归一化?

http://sofasofa.io/forum_main_post.php?postid=1000375

引用的两个链接中都提到,需要先做z-score的归一化,均值为0,方差为1。

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

有助于求解更准确。

posted @ 2021-10-23 16:16  lypbendlf  阅读(161)  评论(0编辑  收藏  举报