随笔分类 -  数据挖掘

摘要:数据挖掘导论 第四章 分类:基本概念、决策树与模型评估 分类的定义:分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。 目标函数也称为分类模型,有两个主要目的:1、描述性建模 2、预测性建模 分类适用于预测两元或标称类型的数据集,即离散的数据集。 决策树分类法 选择 阅读全文
posted @ 2016-10-28 16:18 kinsomy 阅读(694) 评论(0) 推荐(0)
摘要:四种主要的数据挖掘任务: 1、预测建模任务 分类:用于预测离散的目标变量 回归:用于预测连续的目标变量 2、关联分析 3、聚类分析 4、异常检测 主要的数据质量问题:存在噪声和离群点,数据遗漏、不一致或重复,数据有偏差,或者在别的方面,数据不代表描述所设想的现象或总体情况。 测量标度:将数值或符号值 阅读全文
posted @ 2016-10-23 15:25 kinsomy 阅读(1832) 评论(0) 推荐(0)