12 2017 档案

数据挖掘复习笔记(二、数据预处理)
摘要:(一)数据对象、属性 数据集由数据对象组成。一个数据对象代表一个实体。属性是一个数据字段,表示数据对象的一个特征。 可以用多种方法组织属性类型: 1.标称属性(相当于枚举类型)、序数属性、数值属性。 2.离散属性、连续属性 (二)数据描述 1.中心趋势度量:均值、中位数、众数、中列数 2.离散趋势度 阅读全文

posted @ 2017-12-07 14:30 起名真TM烦 阅读(488) 评论(0) 推荐(0)

数据挖掘复习笔记(三、关联规则分析)
摘要:1.关联规则分析的定义 关联分析(Association Analysis)用于发现隐藏在大型数据集中的令人感兴趣的联系。联系的表示方式一般为关联规则或频繁项集,例:{尿布}→{啤酒}。 2.关联规则分析的基本概念 项集:项的集合称为项集。一个包含k个数据项的项集就称为k−项集。 项集的支持度:整个 阅读全文

posted @ 2017-12-07 14:28 起名真TM烦 阅读(2446) 评论(0) 推荐(0)

数据挖掘复习笔记(四、回归及分类)
摘要:1.分类的定义 分类是对数据集进行学习并构造一个拥有预测功能的分类模型,用于预测未知样本的类标号,如:根据电子邮件的标题和内容预测该邮件是否为垃圾邮件。 分类和回归都有预测的功能,但是:分类预测的输出为离散的属性;回归预测的输出为连续属性值,例如:预测未来某银行客户会流失或不流失,这是分类任务,预测 阅读全文

posted @ 2017-12-07 14:28 起名真TM烦 阅读(394) 评论(0) 推荐(0)

数据挖掘复习笔记(一、引论)
摘要:(一)数据挖掘的定义 数据挖掘就是从大量的、不完全的、有噪声的、模糊的实际应用数据中,提取隐含的、用户感兴趣的信息的过程。 (二)数据挖掘的任务 描述任务:寻找历史数据中隐含信息。(关联分析、聚类分析、离群点分析、概念描述) 预测任务:预测是利用历史数据找出变化规律、建立模型,并由此模型对未来的数据 阅读全文

posted @ 2017-12-07 14:27 起名真TM烦 阅读(431) 评论(0) 推荐(0)

导航