读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.1 为什么要预处理数据
摘要:
有大量数据预处理技术。数据清理可以去掉数据中的噪音,纠正不一致。数据集成将数据由多个源合并成一致的数据存储,如数据仓库。数据变换(如规范化)也可以使用。例如,规范化可以改进涉及距离度量的挖掘算法的精度和有效性。数据归约可以通过聚集、删除冗余特征或聚类等方法来压缩数据。这些技术不是互斥的,可以一起使用。这些数据处理技术在数据挖掘之前使用,可以大大提高数据挖掘模式的质量,降低实际挖掘所需要的时间。 阅读全文
posted @ 2008-08-02 19:02 itolssy 阅读(735) 评论(0) 推荐(0)
浙公网安备 33010602011771号