奇异值分解 SVD分解
若\(A \in \mathbb{R}^{m\times n},rank(A) = r\),则有SVD分解 :
\(SVD\)分解有三种形式:
- full SVD: \(U,V\)是方阵,且为酉阵,\(U \in \mathbb{C}^{m\times m},V\in\mathbb{^{n\times n}},D\in\mathbb{R}^{m\times n}\),且\(D\)对角线上为\(n\)个奇异值。
- reduced SVD:\(U,V\)为半酉阵,\(U\in\mathbb{R}^{m\times n},V\in \mathbb{R}^{n\times r},D\in\mathbb{R}^{n\times n}\)且\(D\)对角线上为\(n\)个奇异值。
- truncated SVD:\(P,Q\)为半酉阵,\(P\in\mathbb{R}^{m\times k},Q\in \mathbb{R}^{k\times r}\),\(k\)取前\(k\)个最大的奇异值,多用于数据降维。
定理准备
定理1: 对于任意矩阵\(A\),有\(A^HA\)与\(AA^H\)为半正定Hermite阵
证明:略
定理2:设\(A\in\mathbb{C}^{m\times n}_r\),\(\lambda_i\)为\(A^HA\)的正特征值,\(\mu_i\)为\(A^HA\)的正特征值,\(r\geq i\geq1\),\(x_i\)为\(AA^H\)的特征向量,则\(A^Hx\)为\(A^HA\)的特征向量,且有
证明:
由于\(A^HAx=\lambda_ix(\lambda_i\neq0)\) ,,两端同时乘以\(A\)矩阵,则有
则\(\lambda_i\)为\(AA^H\)的正特征值。
故\(AA^H\)和\(A^HA\)具有相同的特征值,且若\(x\)为\(AA^H\)的特征向量,则\(A^Hx\)为\(A^HA\)的特征向量
引理1 :若\(\frac{x_i}{|x_i|}\)为\(AA^H\)的非零特征值\(\lambda_i\)单位特征向量,则\(\frac{1}{\sqrt{\lambda_i}}A^H\frac{x_i}{|x_i|}\) 为\(A^HA\)的特征值\(\lambda_i\)对应的单位特征向量
证明:显然
full SVD
设\(A\in\mathbb{C}^{m\times n}_r\),\(U\)为\(AA^H\)得单位特征向量组成的矩阵,\(V\)为\(A^HA\)单位特征向量组成的矩阵,因为\(AA^H\)为正规矩阵,则有:
其中\(U\in\mathbb{C}^{m\times m}\),设\(\lambda_1,\lambda_2...\lambda_r\)为\(AA^H\)的非零特征值,\(x_1,x_2,...,x_r\)为对应的特征向量,
\(x_{r+1},...x_m\) 为\(AA^H\)零特征值对应的特征向量,\(x'_{r+1},...,x'_n\)为\(A^HA\)矩阵零特征值对应的特征向量,则有
由于0特征值以及对应的特征向量在运算中不起作用,可以去除,则
取\(V'\)
由引理1 得
即
将矩阵\(U',V'\)分别扩充为\(U\),\(V\),将\(D'\)分别向右方和下方扩充为\(m\times n\)维矩阵,扩充部分均为0,有
即
即为 full SVD
reduced SVD
将full SVD形式中零特征值对应的部分全部去掉,即得到reduced SVD,即:

浙公网安备 33010602011771号