摘要: 房租预测 数据清洗 1. 读入数据 2. 缺失值处理 通过探索性数据分析发现,rentType、buildYear、uv、pv等特征列具有缺失值,采取填充的方式处理,如下表 | 特征列 | 填充方式 | | | | | rentType | 填充众数 | | buildYear | 填充众数 | | 阅读全文
posted @ 2020-01-09 20:23 durobert 阅读(341) 评论(0) 推荐(0)
摘要: 房租预测 赛题分析 赛题分析的目的主要是通过探索性数据分析(EDA),对比赛数据产生一定的了解,方便后续特征工程的进行和模型的构建。主要包括缺失值分析、特征值分析、是否有单调特征列、特征 nunique 分布、统计特征值出现频次大于 100 的特征、Label 分布以及不同特征值的样本的 label 阅读全文
posted @ 2020-01-07 14:45 durobert 阅读(364) 评论(0) 推荐(0)