代码改变世界

集成

2017-07-03 20:42  Rstudent  阅读(612)  评论(0)    收藏  举报
  1. 什么是集成

总的来说,集成是结合两个或多个相似或者不相似算法(算法也被称基础学习者)的一种技术。这么做可以使系统混合所有基础学习者的预测,使其更具鲁棒性。它可以被理解为一个会议室中的多个交易者预测股票的价格是涨还是跌。

 

因为他们对股票市场的理解不同,也就导致了从问题陈述到期望输出之间的映射函数的不同。因此,他们应该根据自己对市场的理解,对股票价格做出不同的预测。

 

当做最后决策时,我们应该考虑这些所有的预测结果。这会使我们的最后决策更具鲁棒性,准确性和不太可能的偏见。如果其中一个交易者单独做出这个决定,最后的决定。

你可以考虑另外一个多轮面试的例子。最终决定应聘者能力的通常是由所有面试官反馈为基础得出的。尽管单独一个面试官很难全面考察应聘者的所有特点和技能。但是结合多位面试官通常较好的评估应聘者的能力。

 

  1. 集成的类型

在深入了解之前,你应该了解一些基本概念:

均值化:指的是在回归问题和分类问题中,将多个模型得到的结果或者概率取其平均。

 

多数投票:指的是在分类问题中,在多个模型输出结果中出现次数最多的预测值即为最终结果

 

加权平均:将不同的权重应用于多个模型的输出,然后取加权平均值,这个均值其实也就意味着不同模型对最终结果的重要性是不一样的。