2018年7月11日
摘要: 数据清洗 对于缺失值的处理,我们分为3类:删除数据,数据插补,不处理.数据的插值是取前后相邻几个数据的平均值作为插值,有拉格朗日插值法,牛顿插值法等. 数据规范化 数据规范化对于基于距离的挖掘算法很重要,将数据映射到0-1之间,或者-1-1之间.主要的方法有:最小-最大规范化,零-均值规范化,小数定 阅读全文
posted @ 2018-07-11 15:41 FantasyBoy 阅读(5195) 评论(0) 推荐(0) 编辑