数据挖掘流程
数据挖掘流程:
(一)数据读取:
- 读取数据,并进行展示
 - 统计数据各项指标
 - 明确数据规模与要完成任务
 
(二)特征理解分析
- 单特征分析,逐个变量分析其对结果的影响
 - 多变量统计分析,综合考虑多种情况影响
 - 统计绘图得出结论
 
(三)数据清洗与预处理
- 对缺失值进行填充
 - 特征标准化/归一化
 - 筛选有价值的特征
 - 分析特征之间的相关性
 
注意:数据挖掘80%的时间用于数据清洗。
(四)建立模型
- 特征数据与标签准备
 - 数据集切分
 - 多种建模算法对比
 - 集成策略等方案改进
 
数据挖掘案例流程github地址:
(一)数据读取:
(二)特征理解分析
(三)数据清洗与预处理
注意:数据挖掘80%的时间用于数据清洗。
(四)建立模型
数据挖掘案例流程github地址: