P19 K近邻算法
https://www.bilibili.com/video/BV184411Q7Ng?p=19
注解:
- 分类算法的判定依据是:目标值是离散值。
注解:
- K-近邻算法最重要的是看距离的远近,距离近的样本归为一类。
- 本例中小王与蓝色的小人距离最近,所以他们归为一类。
- 小王不知道自己所在的区,但是他根据与蓝色小人的距离最近判断自己和蓝色小人在同一区域。
注解:
- KNN算法在20C60年代就提出来了。
注解:
- K近邻的本质是比较样本之间的特征的远近,相似的样本特征也会相距很近,不同类别的样本特征距离也会相距很远。
注解:
- 需要对数据做一下标准化,防止某个特征很大,然后其他特征被淹没其中,距离会决定于比较大的特征。