随笔分类 - data mining
摘要:韩家炜 数据挖掘概念与技术 第三版 习题3.12取鸢尾花数据集iris.data作为待离散化的数据集合,使用ChiMerge算法,对四个数值属性进行离散化,对四个属性进行区间合并,最终合并区间个数剩下为6个即停:即max_interval=6。一、样本数据iris.data数据形式为:前面4列是属性,最后一列是数据类名,5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa6.6,2.9,4.6,1.3,Iris-versicolor5.2,2.7,3.9,1.4,Iris-versic
阅读全文
浙公网安备 33010602011771号