集成学习（Ensemble Learning）

基本思想

思想：不是对弱学习器的结果做简单的逻辑处理，而是再加上一层学习器，分为2层。
第一层是用不同的算法形成T个弱分类器，同时产生一个与原数据集大小相同的新数据集，利用这个新数据集和一个新算法构成第二层的分类器。
我们将弱学习器称为初级学习器，将用于结合的学习器称为次级学习器。对于测试集，我们首先用初级学习器预测一次，得到次级学习器的输入样本，再用
次级学习器预测一次，得到最终的预测结果。
代表方法是Stacking

根据个体学习器的生成方式，目前的集成学习方法大致可分为两类，
1. Boosting：个体学习器间存在强依赖关系，必须串行生成的序列化方法；
  串行：下一个分类器只在前一个分类器预测不够准的实例上进行训练或检验。
2. Bagging：个体学习器间不存在强依赖关系，可同时生成的并行化方法。
  并行：所有的弱分类器都给出各自的预测结果，通过组合把这些预测结果转化为最终结果。

偏差(bias) ：描述的是预测值的期望与真实值之间的差距。偏差越大，越
偏离真实数据，如下图第二行所示。
方差(variance) ：描述的是预测值的变化范围，离散程度，也就是离其期望值的距离。方差越大，数据的分布越分散，如下图右列所示。
偏差刻画了学习算法本身的拟合能力。
方差度量了同样大小的数据集的变动所导致的学习性能的变化。刻画了数据扰动所造成的影响。
Boosting主要关注降低偏差
- Boosting思想，对判断错误的样本不停的加大权重，为了更好地拟合当前数据，所以降低了偏差，因此Boosting能基于泛化性能相当弱的学习器构建出很强的集成。
- boosting是把许多弱的分类器组合成一个强的分类器。
Bagging主要是降低方差
- Bagging思想，随机选择部分样本来训练处理不同的模型，再综合来减小方差，
  因此它在不剪枝决策树、神经网络等易受样本扰动的学习器上效果更明显。
- bagging是对许多强（甚至过强）的分类器求平均。