摘要: 特征工程 - 数据预处理 一、数据预处理的步骤 数据清洗 → 数据集成 → 数据规约 → 特征变换 二、数据清洗 填补缺失值、识别和删除离群点、光滑噪声数据,解决数据不一致性 1、缺失值处理 根据属性的分布特性及重要性(信息量、预测能力)采用不同的方法 → 详细讲解链接 2、离群点处理 常指特定分布区域外的数据,也称噪声 伪 阅读全文
posted @ 2023-12-13 13:48 paramotor 阅读(195) 评论(0) 推荐(0)
摘要: 3 σ 原则 如图所示 正态分布 $\mu$表示平均值 $\sigma$表示方差 ① 蓝色区域 是 和 $\mu$相差 1 个$\sigma$范围内的,占总体的 68.26% ②蓝色 + 红色区域 是 和 $\mu$相差 2 个$\sigma$范围内的,占总体的 95.44% ③蓝色 + 红色 + 黄色区域 是 阅读全文
posted @ 2023-12-13 00:26 paramotor 阅读(182) 评论(0) 推荐(0)