聚类算法优缺点分析

个人博客,欢迎来撩 fangzengye.com

分析

 

算法定义优点缺点
Kmeans 简单、高效、快速收敛、当簇接近高斯分布式,聚类效果好必须定义平均值,K事先给定,K的值影响聚类效果,对异常值影响大
DBSCAN 可以对任意形状进行聚类,对异常值不敏感对簇密度相差较大,不均匀的话,聚类效果不好,样本大,收敛时间长
凝聚式层次聚类 速度快,对异常值影响不大,使用内存小对高斯簇聚类效果不好
EM算法   
基于图 使用降维技术,适合高维空间。对聚类类别少准确率高。对参数敏感,不适合簇里面的样本点少

如何在sklearn调用

 

算法名称函数
K均值聚类算法from sklearn.cluster import KMeans
小批量K均值算法from sklearn.cluster import MiniBatchKMeans
BIRCH层次聚类ffrom sklearn.cluster import Birch
.EM算法from sklearn.mixture import GaussianMixture
DBSCAN算法from sklearn.cluster import DBSCAN
OPTICS算法from sklearn.cluster import OPTICS
Mean Shift算法from sklearn.cluster import MeanShift
谱聚类算法from sklearn.cluster import SpectralClustering

 

[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)

 

posted @ 2020-12-11 10:04  开源的Boy  阅读(2625)  评论(0)    收藏  举报