k-means聚类
原理:
将数据分成 k组 其中每个组内的数据到各组的质心的距离最小 质心的概念是每个组内的数据点均值 当所有组内的数据到各自的质心距离最小时 总的数据最小 距离衡量用误差平方和SSE表示
流程:
1 确立SSE函数以供调用
2 随机生成 K个质心
3 对于每一个数据点 计算数据点到K个质心的距离 并分配给距离最小的组
4 如果 没有数据点分配结果发生改变 则结束 否则重新计算质心
5 重复步骤 3 4
方法:
第一步:
生成一个计算SSE的函数

第二步:
生成随机质心

第三步:
计算每个数据到质心的距离并将数据分配给各个分组

第四步:
计算质心

最后:


浙公网安备 33010602011771号