摘要:
一、数据预处理的步骤 数据清洗 → 数据集成 → 数据规约 → 特征变换 二、数据清洗 填补缺失值、识别和删除离群点、光滑噪声数据,解决数据不一致性 1、缺失值处理 根据属性的分布特性及重要性(信息量、预测能力)采用不同的方法 → 详细讲解链接 2、离群点处理 常指特定分布区域外的数据,也称噪声 伪 阅读全文
一、数据预处理的步骤 数据清洗 → 数据集成 → 数据规约 → 特征变换 二、数据清洗 填补缺失值、识别和删除离群点、光滑噪声数据,解决数据不一致性 1、缺失值处理 根据属性的分布特性及重要性(信息量、预测能力)采用不同的方法 → 详细讲解链接 2、离群点处理 常指特定分布区域外的数据,也称噪声 伪 阅读全文
posted @ 2023-12-13 13:48
paramotor
阅读(195)
评论(0)
推荐(0)
摘要:
如图所示 正态分布 $\mu$表示平均值 $\sigma$表示方差 ① 蓝色区域 是 和 $\mu$相差 1 个$\sigma$范围内的,占总体的 68.26% ②蓝色 + 红色区域 是 和 $\mu$相差 2 个$\sigma$范围内的,占总体的 95.44% ③蓝色 + 红色 + 黄色区域 是 阅读全文
如图所示 正态分布 $\mu$表示平均值 $\sigma$表示方差 ① 蓝色区域 是 和 $\mu$相差 1 个$\sigma$范围内的,占总体的 68.26% ②蓝色 + 红色区域 是 和 $\mu$相差 2 个$\sigma$范围内的,占总体的 95.44% ③蓝色 + 红色 + 黄色区域 是 阅读全文
posted @ 2023-12-13 00:26
paramotor
阅读(182)
评论(0)
推荐(0)

浙公网安备 33010602011771号