摘要:
详见 F:\工程硕士\d电子书\26 数据挖掘小结:1. C4.5C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进行剪枝; 3) 能够完成对连续属性的离散化处理; 4) 能够对不完整数据进行处理。C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。2. The k-means algorithm 阅读全文
posted @ 2013-06-20 22:01
张纯睿
阅读(305)
评论(0)
推荐(0)
摘要:
Omlogic 晶晨 阅读全文
posted @ 2013-06-20 08:56
张纯睿
阅读(191)
评论(0)
推荐(0)
浙公网安备 33010602011771号