R语言聚类方法&主要软件包-K-means

主要4中软件包

stas:主要包含基本统计函数。

cluster:用于聚类分析。

fpc:含聚类算法函数(固定聚类、线性回归聚类等)。

mclust:处理高斯分布混合模型,通过EM算法实现聚类、分类及密度估计等。

kmeans()函数用法:

kmeans(x,centers,iter.max=10,nstart=1,algorithm=c("Hartigan-Wong","Lloyd","For-gy","MacQueen")

library("xlsx")
accountinfo <- read.xlsx("account.xlsx",1,header = TRUE) #载入数据
dim(accountinfo)
head(accountinfo)

account_km <- kmeans(accountinfo[,-1],centers = 3) #自定义为3类
print(account_km) #输出结果

3类样本数分别为:43002,12509,2294

中心点坐标为:

1 1.468350 102.2073
2 4.070589 396.2660
3 8.369224 937.3692

组内平方和为:197660145 152158338 254995794

 

posted @ 2016-12-01 14:32  石尹  阅读(752)  评论(0)    收藏  举报