Loading

随机森林

【随机森林】是由多个【决策树】构成的,不同决策树之间没有关联。

image

特点

  1. 可以使用特征多数据,且无需降维使用,无需特征选择。
  2. 能够进行特征重要度判断。
  3. 能够判断特征间的相关影响
  4. 不容器过拟合。
  5. 训练速度快、并行。
  6. 实现简单。
  7. 不平衡数据集、可平衡误差。
  8. 特征遗失的数据,仍可以维持准确度。

支持平台

  • scikit-learn
  • Spark MLlib
  • DolphinDB
  • XGBoost

准确度
image

使用步骤

  1. 随机抽样,训练【决策树】
  2. 随机选属性,做节点分裂属性
  3. 重复步骤2,直到不能再分裂。
  4. 建立大量决策树、形成森林。

应用方向

  • 分类 (对离散值的分类)
  • 回归 (对连续值的回归)
  • 聚类 (无监督学习聚类)
  • 异常检测

参考

posted @ 2021-12-13 17:41  量化散仙  阅读(514)  评论(0)    收藏  举报