Python中sklearn.StandardScaler

  • StandardScaler和scale均为Z-score标准化,即减去均值µ除以标准差σ

   X_scaled = (X - X.mean()) / X.std()

    X.mean()为数据集的均值,X.std()为数据集的标准差

  • 数据标准化两种方式(在结果上来看,两种方法区别不大,不过第二种更偏向与实际应用场合)
  1. 将训练集和测试集统一进行标准化处理,此时均值和方差为整个数据的均值和方差
  2. 得到训练集的均值和标准差,用测试集的数据减去训练集的均值除以训练集的标准差

    StandardScaler可以预先生成规则,即生成训练集的均值与标准差,然后利用训练集的均值和标准差去分别标准化训练集和测试集!

posted @ 2021-06-03 17:31  nannanZhang  阅读(493)  评论(0)    收藏  举报