决策树:逼近离散值目标函数

 

适用问题:离散值分类

选择分类能力最好的属性根节点

度量: 熵

 

 正例反例

同属于一类0,正=反 1

 

 

 

 

 

 优选偏置,限定偏置

 

过度拟合:随机错误,噪声  数据太少

 

 

解决:

尽早停止树增长

修剪:

 

 1.错误率降低修剪

 

2.规则后修剪 转换成规则

 

合并连续值属性

 定义新属性,区间中值

增益比率

 

缺少属性值处理:

直接赋值,概率