2020 年 8月 19 日随笔档案 - keeps_you_warm

2020年8月19日

摘要： 1.直接删除适合缺失值数量较小，并且是随机出现的，删除它们对整体数据影响不大的情况 2.使用一个全局常量填充譬如将缺失值用“Unknown”等填充，但是效果不一定好，因为算法可能会把它识别为一个新的类别，一般很少用 3.使用均值或中位数代替优点：不会减少样本信息，处理简单。缺点：当缺失数据不是阅读全文

posted @ 2020-08-19 18:34 keeps_you_warm 阅读(278) 评论(0) 推荐(0)

公告