摘要:
当K值的大小不确定时,可以使用ISODATA算法。ISODATA的全称是迭代自组织数据分析法。在K均值算法中,聚类个数K的值需要预先人为地确定,并且在整个算法过程中无法更改。而当遇到高维度、海量的数据集时,人们往往很难准确地估计出K的大小。ISODATA算法就是针对这个问题进行了改进,它的思想也很直 阅读全文
posted @ 2021-08-06 11:03
bonelee
阅读(732)
评论(0)
推荐(0)
摘要:
k-means ++介绍:k-means++算法选择初始seeds的基本思想就是:初始的聚类中心之间的相互距离要尽可能的远。算法步骤:(1)从输入的数据点集合中随机选择一个点作为第一个聚类中心(2)对于数据集中的每一个点x,计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)(3)选择一个新的数 阅读全文
posted @ 2021-08-06 10:59
bonelee
阅读(756)
评论(0)
推荐(0)

浙公网安备 33010602011771号