Boosting算法之Adaboost和GBDT

　　Boosting是串行式集成学习方法的代表，它使用加法模型和前向分步算法，将弱学习器提升为强学习器。Boosting系列算法里最著名的算法主要有AdaBoost和梯度提升系列算法(Gradient Boost，GB)，梯度提升系列算法里面应用最广泛的是梯度提升树(Gradient Boosting Decision Tree，GBDT)。

一、Adaboost

1、Adaboost介绍

　　Adaboost算法通过在训练集上不断调整样本权重分布，基于不同的样本权重分布，重复训练多个弱分类器，最后通过结合策略将所有的弱分类器组合起来，构成强分类器。Adaboost算法在训练过程中，注重减少每个弱学习器的误差，在训练下一个弱学习器时，根据上一次的训练结果，调整样本的权重分布，更加关注那些被分错的样本，使它们在下一次训练中得到更多的关注，有更大的可能被分类正确。

Adaboost算法框架图

2、Adaboost算法过程

1)初始化样本权重，一共有n个样本，则每个样本的权重为1/n

2)在样本分布D_t上，训练弱分类器，for t=1,2，……T：

a、训练分类器h_t

b、计算当前弱分类器的分类误差率

c、判断误差率是否小于0.5，是则继续，否则退出循环

d、计算当前弱分类器的权重系数alpha值

e、根据alpha值调整样本分布D_t+1

如果样本被正确分类，则该样本的权重更改为：

如果样本被错误分类，则该样本的权重更改为：

3)组合弱分类器得到强分类器

3、算法伪代码：

　　AdaBoost算法每一轮都要判断当前基学习器是否满足条件，一旦条件不满足，则当前学习器被抛弃，且学习过程停止。Adaboost算法使用指数损失函数，通过最小化指数损失函数，得到在每次迭代中更新的权重参数计算公式。AdaBoost算法使用串行生成的序列化方法，多个基学习器之间存在强依赖关系。Adaboost的每一个弱分类器的目标，都是为了最小化损失函数，下一个弱分类器是在上一个分类器的基础上对错分样本进行修正，所以， AdaBoost算法是注重减小偏差的算法。

　　Adaboost提供的是一种框架，可使用任何分类器作为基学习器，适用很多分类场景，通常可以获得不错的分类效果，例如，基于Adaboost的人脸检测算法。

二、GBDT

1、GBDT介绍

　　GBDT在竞赛和工业中都经常使用，能有效的应用于分类，回归，排序问题，通常能有不错的效果，是一种应用非常广泛的算法。GBDT是梯度提升算法，也是采用加法模型。GBDT以CART回归树作为基学习器，通过迭代，每次通过拟合负梯度来构建新的CART回归树，通过构建多颗CART树来降低模型的偏差，实现更好的分类性能。GBDT的核心思想是在每次创建新的CART回归树时，通过拟合当前模型损失函数的负梯度，来最小化损失函数。GBDT用于分类和回归时都使用CART回归树，分类时使用指数损失或对数损失，回归时使用平方误差损失函数，绝对值损失函数，Huber损失函数等。当GBDT使用平方误差作为损失函数时，负梯度正好是残差。

　　GBDT用CART回归树为基分类器，在每次构建新树时，将样本在当前模型的残差作为样本标签来训练下一颗树，经过多次迭代提升模型的分类性能。决策树和GBDT虽然结果相同，但是决策树容易过拟合，泛化能力差，可能在当前训练集上表现较好，在其他数据集上效果较差，而GBDT是结合了多颗树模型，具有较好的泛化能力。

2、GBDT回归算法

　　GBDT算法过程就是创建多颗CART回归树的过程，只是在创建下一颗树的时候拟合当前模型的负梯度，就是将样本在当前模型的负梯度作为标签，去构建下一颗树。GBDT用于分类时也使用CART回归树，输出类别值，不能直接拟合负梯度，这里只介绍GBDT回归算法。

输入：训练集D={(x₁,y₁),(x₂,y₂),……,(x_m,y_m)}，最大迭代次数T，损失函数L

输出：强学习器f(X)

1) 初始化弱学习器