1. 独热编码(离散变量) eg: ——>0,1 对二分类没有实际作用,适应多分类
OneHotEncoder
2. 连续变量分箱 离散化
等宽,uniform(KBinsDiscretizer)收到异常值影响
等频,quantile 忽略异常值影响
聚类 cluster.KMeans
3. 分组统计特征