摘要:        
在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值、异常值、不一致的值、重复数据及含有特殊符号(如#、¥、*)的数据 数据清洗:删除原始数据集中的无关数据、重复数据、平滑噪声数据、处理缺失值、异常值等 缺失值处理:删除记    阅读全文
        
            posted @ 2017-02-27 23:39
Little_Rookie
阅读(31768)
评论(0)
推荐(2)
        
        
                    
                
浙公网安备 33010602011771号