摘要: 花了两天时间将cart算法中离散数据分类写完(后面还有连续数据的处理和决策树裁剪)。这次感觉比id3实现要更有成就感,毕竟一般以上的代码自己写的。不过看看写好的代码还是有些不堪回首啊。写代码还不熟练以后要多加锻炼!cart算法介绍:与id3相比cart主要在度量参数方面不同,cart用gini指标用作属性划分的标准。,其中pi为D中元素属于Ci类的概率。对于元素的二元分裂由另一公式判断:对于单列属性的二元分裂要选取GiniA(D)最小的一个来最为该属性列上的一个合理划分。而选择作为节点的属性列也要根据最小的gini指标判断。大致的特点就是这样。1 for (int i = 0; i < 阅读全文
posted @ 2010-04-08 17:28 asdffdas 阅读(3052) 评论(1) 推荐(0) 编辑