2018年6月7日
摘要: 上次的随机逻辑回归模型是发掘自变量和因变量的线型相关,决策树和神经网络是非线型关系变量的筛选. 用的是决策树算法中的ID3算法(基于信息熵),最终使分类后的数据集的熵最小,C4.5决策树算法利用信息增益率划分数据集,CART决策树算法是利用Gini(基尼)指数划分数据集 阅读全文
posted @ 2018-06-07 15:34 FantasyBoy 阅读(332) 评论(0) 推荐(0) 编辑
摘要: 适用因变量一般有1和0(是否)两种取值,表示取值为1的概率. 采用随机逻辑回归剔除自变量(剔除false),逻辑回归的本质还是一种线型模型,被筛选掉的变量不一定就跟结果没关系,可能存在非线型相关. 阅读全文
posted @ 2018-06-07 14:58 FantasyBoy 阅读(247) 评论(0) 推荐(0) 编辑