K近邻法(k-nearest neighbors,KNN)

一、KNN

 

k近邻算法是一种基本分类和回归方法

简单描述就是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分为这个类。

 

 

KNN示例

 

 

 

 

k -NN分类的示例测试样品(绿点)应分类为蓝色正方形或红色三角形。如果k = 3(实线圆),则将其分配给红色三角形,因为内部圆内部只有2个三角形,而只有1个正方形。如果k = 5(虚线圆),则将其分配给蓝色正方形(外部圆内的3个正方形对2个三角形)。

 

 

 

二、如何確定K值

參考 https://blog.csdn.net/v_july_v/article/details/8203674

 

 

 

 

參考資料:

《統計學習方法》 --李航

https://www.analyticsvidhya.com/blog/2018/03/introduction-k-neighbours-algorithm-clustering/

https://zhuanlan.zhihu.com/p/25994179

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

https://blog.csdn.net/v_july_v/article/details/8203674

 

posted @ 2021-01-03 14:41  蓝莓DeepL  阅读(328)  评论(0)    收藏  举报