07 2016 档案

摘要:决策树经验熵是针对所有样本的分类结果而言经验条件熵是针对每个特征里每个特征样本分类结果之特征样本比例和基尼不纯度简单地说就是从一个数据集中随机选取子项,度量其被错误分类到其他分组里的概率决策树算法使用轴平行分割来表现具体一定的局限性C5.0算法--可以处理数值型和缺失 只使用最重要的特征--使用的熵 阅读全文
posted @ 2016-07-25 10:52 payton数据之旅 阅读(2125) 评论(0) 推荐(0)
摘要:组合预测模型 基于R语言的模型组合 组合预测模型的普遍形式为各个单项预测模型的加权平均, 因此组合预测模型的重点在于加权系数的确定。如果对各个单项预测模型的加权系数赋值合理, 那么整个组合预测模型的预测精度也会相应提高。目前常用的方法有算术平均法、 最优权数法、 方差倒数法等方差倒数法是 Bates 阅读全文
posted @ 2016-07-25 10:40 payton数据之旅 阅读(3684) 评论(0) 推荐(0)
摘要:R-xgboost模型 是"极端梯度上升"(Extreme Gradient Boosting)的简称 xgboost: 速度快效果好的boosting模型 [plain] view plain copy install.packages("xgboost") library(xgboost) da 阅读全文
posted @ 2016-07-25 10:34 payton数据之旅 阅读(1000) 评论(0) 推荐(0)