摘要: 1.直接删除 适合缺失值数量较小,并且是随机出现的,删除它们对整体数据影响不大的情况 2.使用一个全局常量填充 譬如将缺失值用“Unknown”等填充,但是效果不一定好,因为算法可能会把它识别为一个新的类别,一般很少用 3.使用均值或中位数代替 优点:不会减少样本信息,处理简单。缺点:当缺失数据不是 阅读全文
posted @ 2020-08-19 18:34 keeps_you_warm 阅读(213) 评论(0) 推荐(0) 编辑