随笔分类 - 数据挖掘
摘要:数据挖掘导论 第四章 分类:基本概念、决策树与模型评估 分类的定义:分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。 目标函数也称为分类模型,有两个主要目的:1、描述性建模 2、预测性建模 分类适用于预测两元或标称类型的数据集,即离散的数据集。 决策树分类法 选择
阅读全文
摘要:四种主要的数据挖掘任务: 1、预测建模任务 分类:用于预测离散的目标变量 回归:用于预测连续的目标变量 2、关联分析 3、聚类分析 4、异常检测 主要的数据质量问题:存在噪声和离群点,数据遗漏、不一致或重复,数据有偏差,或者在别的方面,数据不代表描述所设想的现象或总体情况。 测量标度:将数值或符号值
阅读全文

浙公网安备 33010602011771号