摘要: 1,特征分布 统计特征的频次分布。看一下特征是否符合正态分布,特征是不是大部分情况都为同一个值。 (数据分布)大部分时候特征并不符合正态分布,如果为了后续分析,可以考虑对数变换等操作转化成正态分布。 (覆盖度)特征是否大部分为同一个值,主要是考虑到某些特征有可能绝大多数都是同一个,这样的特征没有什么 阅读全文
posted @ 2018-07-24 15:30 echo_90 阅读(275) 评论(0) 推荐(0)
摘要: 1, 结合业务,分析数据,并构造和提取特征 2,对特征进行分析(缺失值、异常值、分布、特征之间的相关性)和预处理 3,建模 4,模型评价 5,选择合适的模型,对新数据进行预测 阅读全文
posted @ 2018-07-24 14:47 echo_90 阅读(119) 评论(0) 推荐(0)