谱聚类算法数学公式推导,谱聚类数学建模
谱聚类的数学推导过程如下:
-
构造相似矩阵W和度矩阵D
- 相似矩阵W:通常使用高斯核函数计算数据点间的相似度\[W_{ij} = \exp\left(-\frac{\|x_i - x_j\|^2}{2\sigma^2}\right) \]其中\(\sigma\)为带宽参数
- 度矩阵D:对角矩阵,\(D_{ii} = \sum_{j=1}^n W_{ij}\)
- 相似矩阵W:通常使用高斯核函数计算数据点间的相似度
-
拉普拉斯矩阵计算与标准化
- 非标准化拉普拉斯矩阵:\(L = D - W\)
- 标准化形式(对称拉普拉斯矩阵):\[L_{sym} = D^{-1/2}LD^{-1/2} = I - D^{-1/2}WD^{-1/2} \]其中\(D^{-1/2}\)是度矩阵的逆平方根对角矩阵
-
特征值分解
求解\(L_{sym}\)的最小k个特征值对应的特征向量\(f_1,...,f_k\),满足:\[L_{sym}f = \lambda f \]这些特征向量对应于图的最优切割方向
-
构造特征矩阵F
- 将特征向量按列排列:\(F = [f_1,...,f_k] \in \mathbb{R}^{n×k}\)
- 行标准化:\(F_{ij} = \frac{F_{ij}}{\sqrt{\sum_{k} F_{ik}^2}}\)
使每个样本点在新的特征空间中具有单位范数
-
最终聚类
对F的行向量执行k-means聚类,目标函数为:\[\min_C \sum_{i=1}^k \sum_{x \in C_i} \|x - \mu_i\|^2 \]其中\(C_i\)表示第i个簇,\(\mu_i\)为簇中心
关键数学性质:
- 拉普拉斯矩阵半正定性:对任意向量\(f \in \mathbb{R}^n\)有\(f^TLf = \frac{1}{2}\sum_{i,j}W_{ij}(f_i-f_j)^2 \geq 0\)
- 标准化后的\(L_{sym}\)特征值在[0,2]区间内,最小特征值为0对应全1向量
自动化学习。

浙公网安备 33010602011771号