摘要: 1、环境 单机版、windows系统、python3.6、gensim模块 参考文献: https://pypi.org/project/gensim/ https://radimrehurek.com/gensim/ https://www.jianshu.com/p/6e07729c6c5b 2 阅读全文
posted @ 2019-02-17 16:35 echo_90 阅读(570) 评论(0) 推荐(0)
摘要: 1,特征分布 统计特征的频次分布。看一下特征是否符合正态分布,特征是不是大部分情况都为同一个值。 (数据分布)大部分时候特征并不符合正态分布,如果为了后续分析,可以考虑对数变换等操作转化成正态分布。 (覆盖度)特征是否大部分为同一个值,主要是考虑到某些特征有可能绝大多数都是同一个,这样的特征没有什么 阅读全文
posted @ 2018-07-24 15:30 echo_90 阅读(275) 评论(0) 推荐(0)
摘要: 1, 结合业务,分析数据,并构造和提取特征 2,对特征进行分析(缺失值、异常值、分布、特征之间的相关性)和预处理 3,建模 4,模型评价 5,选择合适的模型,对新数据进行预测 阅读全文
posted @ 2018-07-24 14:47 echo_90 阅读(119) 评论(0) 推荐(0)