Fork me on GitHub
摘要: 预处理操作是机器学习整个周期中必不可少的一个过程,也是最能快速改善模型性能的一个过程,往往稍微转换一下特征属性的形态,就能得到性能的极大提升。当然,数据预处理绝对也是耗时最长的一个过程,这一过程不仅要求洞悉整个数据集结构分布,还要探查每一个特征属性细节情况,并作出应对处理,使数据以最适合的状态传输给模型。 针对预处理操作,sklearn中提供了许多模块工具,灵活使用工具可以让数据预处理轻松很多。 本文简要介绍数据预处理中的一些主要方法,并结合sklearn中提供的模块进行实践。 阅读全文
posted @ 2019-12-17 07:51 奥辰 阅读(1789) 评论(0) 推荐(2) 编辑