摘要: 1.输出XGBoost特征的重要性from matplotlib import pyplotpyplot.bar(range(len(model_XGB.feature_importances_)), model_XGB.feature_importances_)pyplot.show()XGBoost 特征重要性绘图也可以使用XGBoost内置的特征重要性绘图函数# plot feature i... 阅读全文
posted @ 2018-08-26 10:27 Jean_V 阅读(17297) 评论(0) 推荐(0) 编辑
摘要: 1.Distance correlation(距离相关系数)https://blog.csdn.net/jiaoaodechunlv/article/details/806555922.Python sklearn.feature_selection.chi2() Exampleshttps://www.programcreek.com/python/example/81276/sklearn.f... 阅读全文
posted @ 2018-08-24 09:58 Jean_V 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 1、Python多线程简单讲解-入门必须https://www.cnblogs.com/yeayee/p/4952022.html 阅读全文
posted @ 2018-08-14 18:58 Jean_V 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 1.使用python中的Numpy进行t检验http://www.atyun.com/7476.html2.scipy中的卡方检验http://wiki.mbalib.com/wiki/%E5%8D%A1%E6%96%B9%E6%A3%80%E9%AA%8C3.如何检测数据中的特异值?http://www.360doc.com/content/18/0207/12/50153987_7283366... 阅读全文
posted @ 2018-08-08 09:12 Jean_V 阅读(1396) 评论(0) 推荐(0) 编辑
摘要: 1、scikit-learn 逻辑回归类库使用小结 阅读全文
posted @ 2018-08-07 15:06 Jean_V 阅读(209) 评论(0) 推荐(0) 编辑
摘要: CentOS7 常用命令集合https://blog.csdn.net/o0darknessyy0o/article/details/52072054#t11.centOS7下实践查询版本/CPU/内存/硬盘容量等硬件信息https://blog.csdn.net/dream_broken/article/details/528838832.Centos7 安装Python3的方法https://... 阅读全文
posted @ 2018-08-04 11:02 Jean_V 阅读(133) 评论(0) 推荐(0) 编辑
摘要: (1)TOP5%Kaggler:如何在 Kaggle 首战中进入前 10% | 干货https://www.leiphone.com/news/201703/kCMQyffeP0qUgD9a.html (2)这十套练习,教你如何使用Pandas做数据分析 https://www.kesci.com/ 阅读全文
posted @ 2018-07-17 17:40 Jean_V 阅读(155) 评论(0) 推荐(0) 编辑
摘要: pandas高级操作总结:pandas中的列的分位数,多重聚合(组函数),使用自定义函数进行聚合,在聚合的dataframe上使用apply,移动平均,组数据的基本信息,数据组的遍历,最大互信息数,pearson相关系数 阅读全文
posted @ 2018-07-15 22:29 Jean_V 阅读(1450) 评论(0) 推荐(0) 编辑
摘要: Numpy 的常用操作:创建数组array,复制数组,输出数组array,Numpy中的基本运算,数组处理,数组索引,Numpy中的数据类型,检查数组信息,对数组进行排序 阅读全文
posted @ 2018-07-15 21:46 Jean_V 阅读(1097) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘特征提取方法-汇集 1.基于树模型提取特征 2.基于L1,L2惩罚值提取特征 3.递归特征消除法提取特征 4.互信息选择法提取特征 5.利用相关系数选择特征 6.卡方检验法提取特征 7.利用方差选择特征 阅读全文
posted @ 2018-07-15 21:20 Jean_V 阅读(7603) 评论(0) 推荐(0) 编辑