聚类算法优缺点分析
分析
| 算法 | 定义 | 优点 | 缺点 | 
| Kmeans | 简单、高效、快速收敛、当簇接近高斯分布式,聚类效果好 | 必须定义平均值,K事先给定,K的值影响聚类效果,对异常值影响大 | |
| DBSCAN | 可以对任意形状进行聚类,对异常值不敏感 | 对簇密度相差较大,不均匀的话,聚类效果不好,样本大,收敛时间长 | |
| 凝聚式层次聚类 | 速度快,对异常值影响不大,使用内存小 | 对高斯簇聚类效果不好 | |
| EM算法 | |||
| 基于图 | 使用降维技术,适合高维空间。对聚类类别少准确率高。 | 对参数敏感,不适合簇里面的样本点少 | 
如何在sklearn调用
| 算法名称 | 函数 | 
|---|---|
| K均值聚类算法 | from sklearn.cluster import KMeans | 
| 小批量K均值算法 | from sklearn.cluster import MiniBatchKMeans | 
| BIRCH层次聚类 | ffrom sklearn.cluster import Birch | 
| .EM算法 | from sklearn.mixture import GaussianMixture | 
| DBSCAN算法 | from sklearn.cluster import DBSCAN | 
| OPTICS算法 | from sklearn.cluster import OPTICS | 
| Mean Shift算法 | from sklearn.cluster import MeanShift | 
| 谱聚类算法 | from sklearn.cluster import SpectralClustering | 
[refers](https://blog.csdn.net/weixin_41019798/article/details/103507875)
    我的个人博客fangzengye.com, 欢迎来撩哦!
原文博主: 热衷开源的宝藏Boy
版权声明: 自由转载-非商用-禁止演绎-保持署名| CC BY-NC-ND 3.0
 
                    
                     
                    
                 
                    
                 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号