摘要: 前面完成了最初的特征选择,基本没有考虑业务逻辑,我直接使用这些特征开始进行预测了。 基于当前业界对XGBoost的推崇,我准备不走弯路,直接上XGBoost进行预测。 从打印的“取数据完成”可以看出数据完全读取了。 下面我们用训练集进行预测,看看说明情况 程序运行了691秒,产生了xgb模型,我们看 阅读全文
posted @ 2023-04-27 21:09 安顺小意思 阅读(412) 评论(0) 推荐(0)
摘要: 特征处理的实现代码如下: #先对年龄缺失值进行处理,这里先按28岁填充处理客户年龄,因为年龄基本服从正态分布,初步考虑分为0-20,20-30,30-40,40-50,50-60,70-80,80-100分别标记为 age_class1,......,age_class8'''Train['NTRL 阅读全文
posted @ 2023-04-03 19:57 安顺小意思 阅读(406) 评论(0) 推荐(0)
摘要: 很久以前就想研究一下到底是怎么因素影响银行个人存款,特别是大众客户(个人日均存款1万-10万元客户)的存款变化到底同说明有关系? 初步的设想是利用大学数学数据统计的基本方法,列出可能的影响因素,通过公开的数字进行分析评价,但受限于数据来源、数据规模、影响因数如服务质量、地域等的量化困难,一直没有认真 阅读全文
posted @ 2023-04-03 17:22 安顺小意思 阅读(1120) 评论(2) 推荐(0)