bagging

  自举汇聚法(bootstrap aggregating),也称为bagging方法,是在从原始数据集选择S次后得到S个新数据集的一种技术。新数据集和原数据集的大小相等。每个数据集都是通过在原始数据集中有放回的抽样得到的。这一性质就允许新数据集中可以有重复的值,而原始数据集的某些值在新集合中则不在出现。

  在S个数据集建好之后,将某个学习算法分别作用于每个数据集就得到了S个分类器。当我们要对新数据进行分类时,就可以应用这S个分类器进行分类。与此同时,选择分类器投票结果中最多的类别作为最后的分类结果。

       random forest与bagging forest不同之处在于在,其在bagging forest随机选取样本训练的基础上,增加了另一层随机,即随机挑选特征进行训练。

posted @ 2019-11-14 14:53  ~宁静致远~  阅读(242)  评论(0编辑  收藏  举报