kis喵

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年4月21日

摘要: 《数据挖掘导论》读书笔记(二) -38 数据预处理讨论的主题:聚集、抽样、降维、特征子集选择、特征创建、离散化和二元化、变量变换 聚集:两个对象或多个对此对象合并成单个对象。如统计温度,可以统计每个月的平均温度,也可以统计每年的平均温度 定量属性:求和过求平均值进行聚集 分类属性:汇总所有类别的集合 阅读全文
posted @ 2020-04-21 10:28 kis喵 阅读(186) 评论(0) 推荐(0)

摘要: 《数据挖掘导论》读书笔记(一) -27 数据挖掘的4大主要任务:预测建模、聚类分析、关联分析、异常检测 数据集是数据对象的集合,数据对象又称为:记录、点、向量、模式、时间、案例、样本、观测或实体 属性:数据对象的性质和特征 测量标度:将数值或符号值与数据对象的属性相关联的规则 属性分类: 根据数值的 阅读全文
posted @ 2020-04-21 10:11 kis喵 阅读(248) 评论(0) 推荐(0)