2015 年 2月 9 日随笔档案 - sangmado

2015年2月9日

摘要： K-Means 是一种基于距离的排他的聚类划分方法。K-Means 基本原理：给定划分数量 k。创建一个初始划分，从数据集中随机地选择 k 个对象，每个对象初始地代表了一个簇中心（Cluster Centroid）。对于其他对象，计算其与各个簇中心的距离，将它们划入距离最近的簇。采用迭代的重定位技术，尝试通过对象在划分间移动来改进划分。所谓重定位技术，就是当有新的对象加入簇或者已有对象离开簇的时候，重新计算簇的平均值，然后对对象进行重新分配。这个过程不断重复，直到各簇中对象不再变化为止。K-Means 算法最常见的实现方式是使用迭代式精化启发法的 Lloyd's algorithm。阅读全文

posted @ 2015-02-09 23:06 sangmado 阅读(25448) 评论(3) 推荐(6) 编辑

{ "熵码匠艺": "Software Craftsmanship" }

公告