一、相关背景
- 有监督学习
给定训练集(x1,y1)(x2,y2) ....(xn,yn)找出他们之间的关系
即:学习一个函数
- 无监督学习
给定训练集:(x1,2,...xn)
学习一个训练集的划分
二、聚类的应用场合
- Image segmentaion
- Data compression
- clustering
- market segmentation
- social network analysis
三、聚类问题的描述
1、聚类分析主要是发现不同的数据类簇/群组,使得组内的数据具有较高的相似性或相关性,而组间的数据具有较低的相似性或相关性

2、类簇划分可以有多个角度
- Well-Separated Clusters
在一个组内的数据比组外的任何点都要接近
- Contiguous Cluster

- Density-based
![]()
-
Center-based

Shared Property or Conceptual Clusters

四、常用的聚类算法
- K-means
- Hierarchical clustering
- Gaussian Mixture Model
- (具体见后面的博文)

浙公网安备 33010602011771号