谱聚类算法数学公式推导,谱聚类数学建模

谱聚类的数学推导过程如下:

  1. 构造相似矩阵W和度矩阵D

    • 相似矩阵W:通常使用高斯核函数计算数据点间的相似度

      \[W_{ij} = \exp\left(-\frac{\|x_i - x_j\|^2}{2\sigma^2}\right) \]

      其中\(\sigma\)为带宽参数
    • 度矩阵D:对角矩阵,\(D_{ii} = \sum_{j=1}^n W_{ij}\)
  2. 拉普拉斯矩阵计算与标准化

    • 非标准化拉普拉斯矩阵:\(L = D - W\)
    • 标准化形式(对称拉普拉斯矩阵):

      \[L_{sym} = D^{-1/2}LD^{-1/2} = I - D^{-1/2}WD^{-1/2} \]

      其中\(D^{-1/2}\)是度矩阵的逆平方根对角矩阵
  3. 特征值分解
    求解\(L_{sym}\)的最小k个特征值对应的特征向量\(f_1,...,f_k\),满足:

    \[L_{sym}f = \lambda f \]

    这些特征向量对应于图的最优切割方向

  4. 构造特征矩阵F

    • 将特征向量按列排列:\(F = [f_1,...,f_k] \in \mathbb{R}^{n×k}\)
    • 行标准化:\(F_{ij} = \frac{F_{ij}}{\sqrt{\sum_{k} F_{ik}^2}}\)
      使每个样本点在新的特征空间中具有单位范数
  5. 最终聚类
    对F的行向量执行k-means聚类,目标函数为:

    \[\min_C \sum_{i=1}^k \sum_{x \in C_i} \|x - \mu_i\|^2 \]

    其中\(C_i\)表示第i个簇,\(\mu_i\)为簇中心

关键数学性质

  • 拉普拉斯矩阵半正定性:对任意向量\(f \in \mathbb{R}^n\)\(f^TLf = \frac{1}{2}\sum_{i,j}W_{ij}(f_i-f_j)^2 \geq 0\)
  • 标准化后的\(L_{sym}\)特征值在[0,2]区间内,最小特征值为0对应全1向量
posted @ 2025-06-11 09:11  ARYOUOK  阅读(46)  评论(0)    收藏  举报