摘要: 如何理解C4.5算法解决了ID3算法的偏向于选择取值较多的特征问题 考虑一个极端情况,某个属性(特征)的取值很多,以至于每一个取值对应的类别只有一个。这样根据$$H(D) H(D|A)$$可以得知后面的那一项的值为0。这样得到信息增益会很大。C4.5算法加了一个惩罚项$$H_A(D) = \sum_ 阅读全文
posted @ 2018-04-04 15:21 狂徒归来 阅读(1090) 评论(0) 推荐(0) 编辑