决策树如何对连续性特征进行分段?
摘要:
特征离散化处理 问题抽象假设训练样本集合D中有n个样本,考察对连续属性a的最佳分段点/划分点。若属性a在这n个样本中有m个不同的取值(m<=n),对这m个值两两之间取中点,可获得m-1个中点作为候选划分点。 选择过程接下来的选择最佳划分点过程和离散属性的虚选择过程类似,以基尼系数或信息增益作为度量, 阅读全文
posted @ 2018-03-22 22:14 mdumpling 阅读(1915) 评论(0) 推荐(0)
浙公网安备 33010602011771号