随笔分类 - 数据挖掘
数据挖掘论文
摘要:决策树算法 决策树算法的基本原理是递归地将数据拆分成子集,以便每一子集包含目标变量类似的状态,这些目标是可预测属性。 优势:可以快速构建挖掘模型,并且创建的模型易于理解
阅读全文
摘要:利用数据挖掘技术进行在线学习行为研究的一般流程 流程:数据收集,数据预处理,应用数据挖掘方法,解释评估应用。 数据收集:一般有在线学习平台自动完成。 数据预处理:是对数据进行清洗并转换成适合数据挖掘的形式的过程。主要包括数据清洗,数据转换和丰富,数据整合以及数据归约等任务。 数据挖掘方法:分类,聚类
阅读全文
摘要:前言 数据挖掘概念 又称为数据库中的知识发现。 决策树概念 决策树方法是利用信息论中的信息增益寻找数据库中具有最大信息量的属性字段,建立决策树的一个节点,再根据该属性字段的不同取值建立树的分支。每个分支子集中重复建立树的下层结点和分支的过程。 优点: 将数据规则可视化,输出结果容易理解,精度较高。
阅读全文
摘要:摘要 1.通过属性规约和属性相关分析对数据进行预处理 2.对预处理后的属性采用信息增益方法构建决策树 3.对决策树表示的知识利用决策表的规则合并方法进行合并 4.最终得出人口变动规律:未婚的高学历人口和未婚、低学历的年轻人口有较高的流动率,老年人口流动率较低,其他人口流动率一般。 引言 什么是数据挖
阅读全文

浙公网安备 33010602011771号