2019年2月11日

数据探索--数据质量分析

摘要: 数据质量分析的任务:检查原始数据中的脏数据(缺失值,异常值,不一致的值,重复数据及含有特殊符号(如#,$,*)的数据) 1 缺失值: 缺失值包括:记录的缺失,记录中某个字段信息的缺失 缺失值处理方法:删除缺失值的记录,对可能值插补,不处理 2 异常值: 异常值包括:录入错误,不合常理的数据 异常值处 阅读全文

posted @ 2019-02-11 13:38 wangzhonghan 阅读(154) 评论(0) 推荐(0)

2019年1月28日

数据挖掘之建模过程

摘要: 1.定义挖掘目标定义挖掘目标即是指要在开始挖掘前,明确挖掘的目的,要达到什么效果?比如对于用户网上看视频,我们想做的可能是对视频进行关联分析或协同过滤,向用户推荐下一部视频;对于商品或新闻下的评论,我们可能想做的是对评论进行情感分析,来判断新闻或商品的正负情感/好坏;对于旅游公司,我们可能想做的是查 阅读全文

posted @ 2019-01-28 13:42 wangzhonghan 阅读(724) 评论(0) 推荐(0)

导航