K-MEANS算法【聚类】
聚类

最简单实用的聚类算法:K-MEANS算法
K值:数据分成几份
质心:簇的中心点
优化目标:K个簇的(每个簇中的每个点距离质心的距离)的和最小
ci中心点,x个别点

工作流程:
设置K值,初始化K个点(随机?),然后计算每个点距离这K个点的距离,视距离最近的那个点为主,然后分成K个家族
然后家族内重新选出宗主(按照某方法求得质心),然后所有的点再根据距离重新认主。
重复上面的过程直到所用样本点都基本不变为止。


初始值(质心的位置)选的不好可能会影响最终的效果,比如下面的最终结果不尽人意


浙公网安备 33010602011771号