KNN算法

可以看到k-近邻算法就是通过距离来解决分类问题。这里我们解决的二分类问题,整个算法结构如下:
l 算距离
给定测试对象𝐼𝑡𝑒𝑚,计算它与训练集中每个对象的距离。
依据公式计算𝐼𝑡𝑒𝑚 与𝐷&,𝐷(,……𝐷*之间的相似度,得到𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷& , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷( , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷* .
l 找邻居
圈定距离最近的k个训练对象,作为测试对象的近邻。
将𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷& , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷( , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷* 排序,若是超过相似度阈值𝑡,则放入邻居集合𝑁𝑁.
l 做分类
根据这k个近邻归属的主要类别,来对测试对象进行分类。
自邻居集合𝑁𝑁中取出前k名,查看它们的标签,对这k个点的标签求和,以多数决,得到𝐼𝑡𝑒𝑚可能类别。

posted on 2019-09-24 15:05  wwdて  阅读(153)  评论(0编辑  收藏  举报

导航