摘要:
鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树,我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如果用全样本去训练m棵决策树显然是不可取的,全样本训练忽视了局部样本的规律,对于模型的泛化能力是有害的 产生n个样本的方法采用Bootstra 阅读全文
posted @ 2018-04-18 10:38
LloydDracarys
阅读(152)
评论(0)
推荐(0)
摘要:
1.特征选取 类别特征选取了: ['air_area_name0', 'air_area_name1', 'air_area_name2', 'air_genre_name', 'air_store_id', 'day_of_week', 'golden_week', 'holiday_flg', 阅读全文
posted @ 2018-04-18 10:37
LloydDracarys
阅读(867)
评论(0)
推荐(0)
摘要:
第一章 Python基础 list是一种有序的可变集合[ ],可以包含不同的数据类型,下标由0开始,到n-1,下标也可以为负数,表示倒数第i个,到-n;可以使用append函数在末尾插入,也可以使用insert函数插入到指定位置;使用pop(i)删除末尾或第i个元素。 tuple又叫元组(),一旦初 阅读全文
posted @ 2018-04-18 10:32
LloydDracarys
阅读(316)
评论(0)
推荐(0)
摘要:
0. 决策树的生成就是递归地构建二叉决策树的过程,对回归树用平方误差最小化准则,对分类树用基尼指数最小化准则,进行特征选择,生成二叉树。 1. Boost方法是一种弱模型的提升方法,从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器,构成一个强分类器。 提升方法有两大关键问题,一是 阅读全文
posted @ 2018-04-18 10:31
LloydDracarys
阅读(337)
评论(1)
推荐(0)

浙公网安备 33010602011771号