摘要: 本文目的最近在看《数据挖掘导论》,此书作为此领域的入门书籍,很有口碑。这几天抽业余时间,看了第二章,觉得该记点什么,否则对不起自己。人总在与遗忘作斗争,好记性不如烂笔头。主要内容本章节主要讨论了数据处理的4个主要方面:数据类型数据质量数据预处理相似度测量数据类型(Type of Data)定义数据的属性,记录,数据集。属性的类型分为4种名称(Noimal):仅仅只是名称,用来区分不同记录,一一对应,如ID有序(Ordinal):可以理解为计算机语言中枚举类型,有序,有限区间(Interval):数字区域,主要用于加减运算,如时间,日期比例(Radio):计算比例,主要用于乘除运算。数据集的类型 阅读全文
posted @ 2012-11-03 20:41 bourneli 阅读(804) 评论(0) 推荐(0) 编辑