Yang

机器学习实践02

今天主要观看了数据预处理部分的视频,完成了数据预处理部分的学习

数据预处理模块主要是对缺失值进行填补、删减数据列、统计一些最大值最小值之类的

缺失值处理包括将缺失值填充为平均数、众数、或者是建立模型进行预测,并对不同类型的特征进行不同缺失值的处理

离群值检测有基于统计的方法,基于近邻的方法,实例有sklearn中的离群值检测,以及怎样处理离群值

标准化就是将数据按照原有规模进行缩放到特定区间,有Z-Score标准化和Min-Max标准化两种‘

离散化和特征值编码就是将非数值特征转化为数值型特征,有多种编码方式

最后学习了一个基于共享单车时租数量预测的案例,综合运用了上面的数据预处理方法。

posted on 2021-02-28 22:17  yangliuliu  阅读(27)  评论(0编辑  收藏  举报

导航