k-近邻算法
摘要:
算法思想:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签。最后选择k个最相似数据中出现次数最多的分类,最为新数据的分类。2.1导入数据导入使用的数据,在此只有2个类标签:A和B2.2实施kNN算法sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True),用迭代器以值为基准进行反向排序,返 阅读全文
posted @ 2014-02-27 19:33 我是咖啡豆哈 阅读(240) 评论(0) 推荐(0)
浙公网安备 33010602011771号