数据挖掘十大算法-KNN的实现

       今天简简单单的实现了下数据挖掘十大算法中的KNN,即临近算法,也就是给定很大的数据量中,给定一个测试距离,则测试数据点在此范围内哪一类型的数据最多,它就最可能属于那一类,一般数据的类型利用分类算法分好,我这里假设是已经分好(随机化分类)。实现效果如下:

       至今我们已经实现了Kmeans、决策树、KNN剩下的7个算法,我们一步一步来,希望大家都有收获,最关键的是,在后面我们将综合更多的算法,写一些战斗航母型程序出来,仅仅看单个只能说是学习。

源码如下:

/Files/liufanping/KNN.rar

posted @ 2012-02-20 20:04  Iveely Liu  阅读(1009)  评论(0编辑  收藏  举报