上一页 1 ··· 3 4 5 6 7
摘要: 鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树,我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如果用全样本去训练m棵决策树显然是不可取的,全样本训练忽视了局部样本的规律,对于模型的泛化能力是有害的 产生n个样本的方法采用Bootstra 阅读全文
posted @ 2018-04-18 10:38 LloydDracarys 阅读(152) 评论(0) 推荐(0)
摘要: 1.特征选取 类别特征选取了: ['air_area_name0', 'air_area_name1', 'air_area_name2', 'air_genre_name', 'air_store_id', 'day_of_week', 'golden_week', 'holiday_flg', 阅读全文
posted @ 2018-04-18 10:37 LloydDracarys 阅读(867) 评论(0) 推荐(0)
摘要: 第一章 Python基础 list是一种有序的可变集合[ ],可以包含不同的数据类型,下标由0开始,到n-1,下标也可以为负数,表示倒数第i个,到-n;可以使用append函数在末尾插入,也可以使用insert函数插入到指定位置;使用pop(i)删除末尾或第i个元素。 tuple又叫元组(),一旦初 阅读全文
posted @ 2018-04-18 10:32 LloydDracarys 阅读(316) 评论(0) 推荐(0)
摘要: 0. 决策树的生成就是递归地构建二叉决策树的过程,对回归树用平方误差最小化准则,对分类树用基尼指数最小化准则,进行特征选择,生成二叉树。 1. Boost方法是一种弱模型的提升方法,从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器,构成一个强分类器。 提升方法有两大关键问题,一是 阅读全文
posted @ 2018-04-18 10:31 LloydDracarys 阅读(337) 评论(1) 推荐(0)
上一页 1 ··· 3 4 5 6 7