摘要: from sklearn.metrics import roc_curve,auc from sklearn.ensemble import RandomForestClassifier import matplotlib.pyplot as plt from sklearn.model_selec 阅读全文
posted @ 2019-02-21 13:48 The_Chain 阅读(7181) 评论(0) 推荐(0) 编辑
摘要: 1,去除线性共线性,使变量数据稀疏。 共线性检测: 1,VIF(方差膨胀因子),1/(1-R**2)以10为分界点,(0-10)不存在多重共线性问题,>10存在多重共线性问题。 (vif包建议5以上则存在共线性问题) from statsmodels.stats.outliers_influence 阅读全文
posted @ 2019-02-21 12:58 The_Chain 阅读(827) 评论(0) 推荐(0) 编辑