随笔分类 -  聚类算法

DBSCAN聚类算法
摘要:基本概念:(Density-Based Spatial Clustering of Applications with Noise)基于密度的噪声应用空间聚类 核心对象:若某个点的密度达到算法设定的阈值则其为核心点。(即r 邻域内点的数量不小于minPoints) ϵ-邻域的距离阈值:设定的半径r 阅读全文

posted @ 2018-10-11 15:23 医疗兵皮特儿 阅读(265) 评论(0) 推荐(0)

K-MEANS算法
摘要:聚类概念: 无监督问题:我们手里没有标签了 聚类:相似的东西分到一组 难点:如何评估,如何调参 要得到簇的个数,需要指定K值 质心:均值,即向量各维取平均即可 距离的度量:常用欧几里得距离和余弦相似度(先标准化) 优化目标: Ci是质心,x是数据,质心到数据的距离 工作流程: 通过不断更新质心来确定 阅读全文

posted @ 2018-10-11 14:16 医疗兵皮特儿 阅读(262) 评论(0) 推荐(0)

导航