K近邻法(k-nearest neighbors,KNN)
一、KNN
k近邻算法是一种基本分类和回归方法。
简单描述就是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分为这个类。
KNN示例

k -NN分类的示例。测试样品(绿点)应分类为蓝色正方形或红色三角形。如果k = 3(实线圆),则将其分配给红色三角形,因为内部圆内部只有2个三角形,而只有1个正方形。如果k = 5(虚线圆),则将其分配给蓝色正方形(外部圆内的3个正方形对2个三角形)。
二、如何確定K值
參考 https://blog.csdn.net/v_july_v/article/details/8203674
參考資料:
《統計學習方法》 --李航
https://www.analyticsvidhya.com/blog/2018/03/introduction-k-neighbours-algorithm-clustering/
https://zhuanlan.zhihu.com/p/25994179
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
https://blog.csdn.net/v_july_v/article/details/8203674
浙公网安备 33010602011771号