LloydDracarys

2018年4月18日

摘要：鉴于决策树容易过拟合的缺点，随机森林采用多个决策树的投票机制来改善决策树，我们假设随机森林使用了m棵决策树，那么就需要产生m个一定数量的样本集来训练每一棵树，如果用全样本去训练m棵决策树显然是不可取的，全样本训练忽视了局部样本的规律，对于模型的泛化能力是有害的产生n个样本的方法采用Bootstra 阅读全文

posted @ 2018-04-18 10:38 LloydDracarys 阅读(152) 评论(0) 推荐(0)

Kaggle比赛（Recruit Restaurant Visitor Forecasting）

摘要： 1.特征选取类别特征选取了： ['air_area_name0', 'air_area_name1', 'air_area_name2', 'air_genre_name', 'air_store_id', 'day_of_week', 'golden_week', 'holiday_flg', 阅读全文

posted @ 2018-04-18 10:37 LloydDracarys 阅读(867) 评论(0) 推荐(0)

Python读书笔记

摘要：第一章 Python基础 list是一种有序的可变集合[ ]，可以包含不同的数据类型，下标由0开始，到n-1，下标也可以为负数，表示倒数第i个，到-n；可以使用append函数在末尾插入，也可以使用insert函数插入到指定位置；使用pop(i)删除末尾或第i个元素。 tuple又叫元组（），一旦初阅读全文

posted @ 2018-04-18 10:32 LloydDracarys 阅读(316) 评论(0) 推荐(0)

BOOST-对误差的再次拟合模型与多模型组合方法

摘要： 0. 决策树的生成就是递归地构建二叉决策树的过程，对回归树用平方误差最小化准则，对分类树用基尼指数最小化准则，进行特征选择，生成二叉树。 1. Boost方法是一种弱模型的提升方法，从弱学习算法出发，反复学习，得到一系列弱分类器，然后组合这些弱分类器，构成一个强分类器。提升方法有两大关键问题，一是阅读全文

posted @ 2018-04-18 10:31 LloydDracarys 阅读(337) 评论(1) 推荐(0)

公告