摘要:
KNN算法的英文名称是K-Nearest Neighbour,即k最近邻算法。它的基本思想是先把所有的训练样例存储起来,当有需要分类的实例时,用该实例和所有的训练样例进行相似度比较,然后找出最相似的k个训练样例,然后查看这个k个训练样例哪个分类占比最高,就把该分类赋给需要分类的实例。比较实例的相似度一般使用距离来度量。优点:算法简单易懂、准确性高、对数据没有特殊要求缺点:对离群值敏感、计算量大、内存需求大适用于数值型定量数据和名词型定性数据代码如下:public class KNN{ /**classify an instance * * @param instance need to ... 阅读全文
posted @ 2013-07-14 23:01
叶莞尔
阅读(642)
评论(0)
推荐(0)
浙公网安备 33010602011771号