摘要: 一、数据清洗 为什么进行数据预处理:初始数据的质量或多或少都存在问题 现实世界中的数据是“脏”的:不完整、噪声、不一致 如何处理缺失数据:忽略元组(直接删),手动添加(工作量大)、自动填写(常用) 如何处理噪声数据:箱线图,删除离群点 如何处理不一致数据:计算推理、替换 二、数据集成 数据集成:将来 阅读全文
posted @ 2022-12-16 21:14 奋发图强的小赵 阅读(114) 评论(0) 推荐(0)