XGboost

决策树

  决策树的几种经典实现方式是ID3,C4.5 和 CART

  分类树:  对一个样本的分类进行预测

    信息熵  度量样本集合纯度的一种指标,熵越大,则说明该数据分类的纯度越纯

 

 

      D表示数据集,假设D共有m个类别,P表示第k个类别占样本总数的比例

    基尼指数  CART用作分类时使用基尼指数作为划分依据  (CART用作回归时使用最小方差作为划分依据)

  回归树:  对样本的某一个值进行预测

posted @ 2022-11-17 22:05  dunimaa  阅读(48)  评论(0)    收藏  举报