matlab的kmeans
matlab的k均值聚类分析,用kmeans命令,能输出类别、距离和、距离等数据。结合silhouette plot,能优化k参数选择。
[IDX,C,sumd,D] = kmeans(X,k)
X是样本,k是类别数目,IDX是与下标对应的类别号,C是每个类别的中心,sumd是距离的和,D是每个点到中心的距离。
为了解决算法局部收敛的问题,可以参照退火法,随机选择初值进行多次计算。kmeans已经集成了该功能
设置‘replicates’属性表示重复计算次数,start属性表示如何选择初值。
silhouette plot用于图示分类性能,其值在-1到1,越大越好。也可以直接计算均值,mean(silhouette)
浙公网安备 33010602011771号