决策树算法

决策树是最经常使用的数据挖掘算法

基本概念

  • 决策树(Decision Tree)

    • 它通过对训练样本的学习,并建立分类规则,然后依据分类规则,对新样本数据进行分类预测,属于有监督学习。
  • 优点

    • 1)决策树易于理解和实现

      • 使用者不需要了解很多的背景知识,通过决策树就能够直观形象的了解分类规则;
    • 2)决策树能够同时处理数值型和非数值型数据

      • 在相对短的时间内,能够对大型数据做出可行且效果良好的结果;

逻辑-类比找对象

决策树分类的思想类似于找对象,例如一个女孩的母亲要给这个女孩介绍男朋友,于是母女俩有了下面的对话:

女儿问:“多大年龄了”;母亲答:“26”
女儿接着问:“长得帅不帅?”;母亲答:“挺帅的。”
女儿问:“收入高不?”;母亲答:“不算很高,中等情况”
女儿问:“是公务员吗?”;母亲答:“是,在财政局上班”
最后,女儿做出决定说:“那好,我去见见!”

这个女孩的决策过程就是典型的分类树决策:
@数据分析-jacky

案例实操

posted on 2017-11-03 09:23  朱元禄  阅读(256)  评论(0编辑  收藏  举报