Loading

奇异值分解 SVD分解

\(A \in \mathbb{R}^{m\times n},rank(A) = r\),则有SVD​分解 :

\[A = UDV \]

\(SVD\)分解有三种形式​:

  • full SVD: \(U,V\)是方阵,且为酉阵,\(U \in \mathbb{C}^{m\times m},V\in\mathbb{^{n\times n}},D\in\mathbb{R}^{m\times n}\),且\(D\)对角线上为\(n\)个奇异值。
  • reduced SVD:\(U,V\)为半酉阵,\(U\in\mathbb{R}^{m\times n},V\in \mathbb{R}^{n\times r},D\in\mathbb{R}^{n\times n}\)\(D\)对角线上为\(n\)个奇异值。
  • truncated SVD:\(P,Q\)为半酉阵,\(P\in\mathbb{R}^{m\times k},Q\in \mathbb{R}^{k\times r}\),\(k\)取前\(k\)个最大的奇异值,多用于数据降维。

定理准备

定理1: 对于任意矩阵\(A\),有\(A^HA\)\(AA^H\)为半正定Hermite阵

证明:略

定理2:设\(A\in\mathbb{C}^{m\times n}_r\),\(\lambda_i\)\(A^HA\)的正特征值,\(\mu_i\)\(A^HA\)的正特征值,\(r\geq i\geq1\)\(x_i\)\(AA^H\)的特征向量,则\(A^Hx\)\(A^HA\)的特征向量,且有

\[\lambda_i = \mu_i >0\\ \]

证明:

由于\(A^HAx=\lambda_ix(\lambda_i\neq0)\) ,,两端同时乘以\(A\)矩阵,则有

\[(A^HA)A^Hx=\lambda_iA^Hx \]

\(\lambda_i\)\(AA^H\)的正特征值。
\(AA^H\)\(A^HA\)具有相同的特征值,且若\(x\)\(AA^H\)的特征向量,则\(A^Hx\)\(A^HA\)的特征向量

引理1 :若\(\frac{x_i}{|x_i|}\)\(AA^H\)的非零特征值\(\lambda_i\)单位特征向量,则\(\frac{1}{\sqrt{\lambda_i}}A^H\frac{x_i}{|x_i|}\)\(A^HA\)的特征值\(\lambda_i\)对应的单位特征向量

证明:显然

\[\frac{1}{\sqrt{\lambda_i}}A^H\frac{x_i}{|x_i|} = \frac{A^Hx_i}{|A^Hx_i|} \]

full SVD​

\(A\in\mathbb{C}^{m\times n}_r\)\(U\)\(AA^H\)得单位特征向量组成的矩阵,\(V\)\(A^HA\)单位特征向量组成的矩阵,因为\(AA^H\)为正规矩阵,则有:

\[U^H\mathop{AA^H}_{m \times m}U = \mathop{DD}_{m\times m} \]

其中\(U\in\mathbb{C}^{m\times m}\),设\(\lambda_1,\lambda_2...\lambda_r\)\(AA^H\)的非零特征值,\(x_1,x_2,...,x_r\)为对应的特征向量,
\(x_{r+1},...x_m\)\(AA^H\)零特征值对应的特征向量,\(x'_{r+1},...,x'_n\)\(A^HA\)矩阵零特征值对应的特征向量,则有

\[\mathop{U}_{m\times m} = [\frac{x_1}{|x_1|},\frac{x_2}{|x_2|},...,\frac{x_r}{|x_r|},...,\frac{x_m}{|x_m|}] \]

\[\mathop{V}_{n\times n} = [\frac{A^Hx_1}{|A^Hx_1|},\frac{A^Hx_2}{|A^Hx_2|},...,\frac{A^Hx_r}{|A^Hx_r|},x'_{r+1},...,x'_n] \]

\[\mathop{D}_{m\times m} = diag\{\sqrt{\lambda_1},\sqrt{\lambda_2},...,\sqrt{\lambda_r},0,...,0\} \]

由于0特征值以及对应的特征向量在运算中不起作用,可以去除,则​

\[U^{'H}\mathop{AA^H}_{m \times m}U^{'} = \mathop{D^{'}D^{'}}_{r\times r} \]

\[\mathop{U^{'}}_{m\times r} = [\frac{x_1}{|x_1|},\frac{x_2}{|x_2|},...,\frac{x_r}{|x_r|}] \]

\[\mathop{D^{'}}_{r\times r} = diag\{\sqrt{\lambda_1},\sqrt{\lambda_2},...,\sqrt{\lambda_r}\} \]

\(V'\)

\[\mathop{V^{'}}_{m\times r} = [\frac{A^Hx_1}{|A^Hx_1|},\frac{A^Hx_2}{|A^Hx_2|},...,\frac{A^Hx_r}{|A^Hx_r|}] \]

由引理1 得​

\[\begin{aligned} U^{'H}AA^HU' & = U^{'H}A[\frac{A^Hx_1}{|x_1|},\frac{A^Hx_2}{|x_2|},...,\frac{A^Hx_r}{|x_r|}]=U^{'H}AV'D \end{aligned} \]

\[\mathop{U^{'H}}_{r\times m} \mathop{A}_{m\times n} \mathop{V^{'}}_{n\times r} = \mathop{D^{'}}_{r\times r} \]

将矩阵\(U',V'\)分别扩充为\(U\)\(V\),将\(D'\)分别向右方和下方扩充为\(m\times n\)维矩阵,扩充部分均为0,有

\[\mathop{U^{H}}_{m\times m} \mathop{A}_{m\times n} \mathop{V}_{n\times n} = \mathop{D''}_{m\times n} \]

即​

\[\mathop{A}_{m\times n} = \mathop{U}_{m\times m} \mathop{D''}_{m\times n} \mathop{V^H}_{n\times n} \]

即为 full SVD​

reduced SVD​

将full SVD形式中零特征值对应的部分全部去掉,即得到reduced SVD,即:​

\[\mathop{A}_{m\times n} = \mathop{U}_{m\times r} \mathop{D'}_{r\times r} \mathop{V^H}_{r\times n} \]

posted @ 2021-02-06 23:47  冰下熔岩  阅读(263)  评论(0)    收藏  举报