K-MEANS算法【聚类】

可视化

聚类

 

 

最简单实用的聚类算法:K-MEANS算法

K值:数据分成几份

质心:簇的中心点

优化目标:K个簇的(每个簇中的每个点距离质心的距离)的和最小

ci中心点,x个别点

 

 工作流程:

设置K值,初始化K个点(随机?),然后计算每个点距离这K个点的距离,视距离最近的那个点为主,然后分成K个家族

然后家族内重新选出宗主(按照某方法求得质心),然后所有的点再根据距离重新认主。

重复上面的过程直到所用样本点都基本不变为止。

 

 

 

 初始值(质心的位置)选的不好可能会影响最终的效果,比如下面的最终结果不尽人意

 

posted @ 2021-12-02 21:09  磕伴  阅读(98)  评论(0)    收藏  举报