分类算法优缺点对比

 

1 贝叶斯分类器

  优点:接受大量数据训练和查询时所具备的高速度,支持增量式训练;对分类器实际学习的解释相对简单

  缺点:无法处理基于特征组合所产生的变化结果

 

2 决策树分类器

  优点:很容易解释一个受训模型,而且算法将最为重要的判断因素都很好的安排在了靠近树的根部位置;能够同时处理分类数据和数值数据;很容易处理变量之间的相互影响;适合小规模数据

  缺点:不擅长对数值结果进行预测;不支持增量式训练

 

3 神经网络

  优点:能够处理复杂的非线性函数,并且能发现不同输入间的依赖关系;支持增量式训练

  缺点:黑盒方法,无法确定推导过程;选择训练数据的比率与问题相适应的网络规模方面,没有明确的规则可以遵循,选择过高的训练数据比率有可能导致网络对噪声数据产生过渡归纳的现象,而选择过低的训练比率,则意味着除了已知数据,网络有可能不会再进一步学习了。

 

4 支持向量机

  优点:通过将分类输入转化成数值输入,可以令支持向量同时支持分类数据和数值数据;适合大规模数据

  缺点:针对每个数据集的最佳核变函数及其相应的参数都是不一样的,而且每当遇到新的数据集都必须重新确定这些函数及其参数;黑盒技术,由于存在高维空间的变换,SVM的分类过程更加难以解释。

 

5 K-最近邻

  优点:能够利用复杂函数进行数值预测,同时又保持简单易懂的特点;合理的数据缩放量;在线(online)技术,新数据可以随时被添加进来,而不必重新进行训练。

  缺点:要求所有训练数据都必须缺一不可;寻找合理的缩放因子比较乏味

posted @ 2013-09-01 13:50  94julia  阅读(6056)  评论(2编辑  收藏  举报