摘要: CHAMELEON是一种两阶段聚类法。第一阶段把点分成很多小的簇;第二阶段根据相近程度合并这些小的簇。第一阶段采用K最邻近法,即把一个点和它最邻近的K个点连接起来。第二阶段计算任意两个簇的互连性RI和紧密性RC,当两个指标都比较大时才合并这两个簇。 相对互连度 $$RI(C_i,C_j)=\frac 阅读全文
posted @ 2011-09-20 18:25 张朝阳 阅读(10632) 评论(19) 推荐(2) 编辑
摘要: DBScan是一种基于密度的聚类算法,它有一个核心点的概念:如果一个点,在距它Eps的范围内有不少于MinPts个点,则该点就是核心点。核心和它Eps范围内的邻居形成一个簇。在一个簇内如果出现多个点都是核心点,则以这些核心点为中心的簇要合并。下图给出DBScan的聚类结果:可以看到DBScan可以发现噪声,即它把(3,14)判定为噪声。到这里你一定有个疑问:为什么(8,3)一个点形成了一个簇,不是一个簇最少应该包含MinPts个点吗,如果只有一个点,那(8,3)应该归为噪声才对呀?其实你仔细阅读下面的代码就会发现原因。在算法运行的早期,(8,3)、(5,3)、(8,6)、(10,4)被划分为一 阅读全文
posted @ 2011-09-20 18:23 张朝阳 阅读(25618) 评论(9) 推荐(2) 编辑