2018年7月6日

R语言中基于聚类的离群点挖掘

摘要: 思路:首先,通过K-means算法将数据点划分为成若K个簇;然后计算每一个数据对象到最近簇的中心距离,来与离群点设置的阈值进行比较,以此来判别该数据对象是否是离群点。 1.读取数据 2.K-meas聚类 3.计算各样本数据到最近中心的距离(nrow=189261是样本记录个数,根据实际情况进行设置) 阅读全文

posted @ 2018-07-06 02:05 小明在线 阅读(475) 评论(0) 推荐(0)

导航