层次化聚类

Hierarchical Clustering(HC).
本文讨论自下而上的聚合(Agglomerative)方法.

输入输出是什么?

输入: 无标签的数据
输出: 一棵层次化的分类树.

算法思想

类似于selective search(SS)方法:

  1. 初始化:
    • ss 利用Graph-base Segmentation方法对整张图片过度分割, 每一个分割出来的超像素都单独成一类.
    • hc 将每一个数据点当作一个类别.
      计算不同类别间的两两相似度.
  2. 找出距离最近的一对类别, 将它们合为一类. 这样就得到了一个新的类别.
    • SS将这一步得到的所有region作为proposal输出.
      然后重新计算相似度.
  3. 重复2直到所有的数据聚为一个类别.

整个过程中会形成一棵分类树. 像k-means这样的聚类算法需要事先选择一个类别数, 往往很麻烦. 而HC可以避免这个麻烦.
但无论是哪种聚类算法, 都需要一个类与类之间的相似度衡量. 这也是最关键最困难之处.

see more in matlab

如何衡量取聚类效果?

posted @ 2017-01-12 19:56  宁静是一种习惯  阅读(574)  评论(0编辑  收藏  举报