随笔分类 - 数据挖掘与分析
摘要:1 数据质量分析 数据质量分析是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础。其主要任务是检查原始数据中是否存在脏数据: (1)缺失值 (2)异常值(outliers) (3)不一致的值 (4)重复数据及含有特殊符号的数据 1.1 缺失值分析 1.2 异常值分析 异常值是指样本中数值明
阅读全文
posted @ 2019-08-26 23:43
少年不识丶愁滋味
摘要:从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模型和趋势,并用这些知识和规律建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;它利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间关系的过程,是统计学、数据库技术和人工智能技术的综合。 1. 数
阅读全文

浙公网安备 33010602011771号