特征工程

1.  独热编码(离散变量)  eg: ——>0,1  对二分类没有实际作用,适应多分类

    OneHotEncoder

2.  连续变量分箱  离散化  

    等宽,uniform(KBinsDiscretizer)收到异常值影响

    等频,quantile  忽略异常值影响

    聚类 cluster.KMeans

3.  分组统计特征

posted @ 2022-11-17 22:02  dunimaa  阅读(32)  评论(0)    收藏  举报