数据预处理

缺失值:

  1. 平均数,众数,中位数,等等填充方式

无量纲化:

  • 数据归一化
  • 数据标准化
  • log

分类的数据:编码,哑变量的方式

  • 特征分类:OrdinalEncoder
  • 标签分类:LabelEncoder
  • 哑变量方式:OnehotEncoder(一般用来处理名义变量)

连续型数据:

  • 二值化:Binarizer
  • 分箱:KBinsdiscretizer

 

posted @ 2020-08-26 11:18  墨心君子  阅读(25)  评论(0)    收藏  举报