Hermite矩阵的酉对角化(谱定理)

Hermite矩阵的酉对角化(谱定理)

基本定义

定义(Hermite矩阵)
设 $ A \in \mathbb{C}^{n \times n} $ 为复矩阵,若其共轭转置等于自身,即

\[A^\dagger = A \]

则称 $ A $ 为 Hermite 矩阵。

定义(酉矩阵)
设 $ U \in \mathbb{C}^{n \times n} $ 为复矩阵,若满足

\[U^\dagger U = I \]

其中 $ I $ 为 $ n \times n $ 单位矩阵,则称 $ U $ 为酉矩阵。酉矩阵全体记为 $ \mathcal{U}_n $,酉矩阵的列向量构成 $ \mathbb{C}^n $ 的标准正交基(即列向量间内积为 0,自身内积为 1)。


设 $ U \in \mathbb{C}^{m \times n} $,若满足

\[U^\dagger U = I \]

我们记满足上述性质的全体 $ U \in \mathbb{C}^{m \times n} $ 为 $ \mathrm{St}(m,n) $(Stiefel 流形),其中 $ m \geq n $,相当于一种非方阵的酉矩阵。注意这里一定要 $ m \geq n $,否则 $ U^\dagger U = I $ 不可能成立。

关键性质

引理(Hermite 矩阵的特征值为实数)
设 $ A $ 为 Hermite 矩阵,$ \lambda $ 为其任一特征值,$ x \neq 0 $ 为对应的特征向量(即 $ Ax = \lambda x $),则 $ \lambda \in \mathbb{R} $。

证明
对等式 $ Ax = \lambda x $ 两边取共轭转置,得:

\[x^\dagger A^\dagger = \overline{\lambda} x^\dagger \]

因 $ A $ 是 Hermite 矩阵($ A^\dagger = A $),故:

\[x^\dagger A = \overline{\lambda} x^\dagger \]

两边右乘 $ x $,结合 $ Ax = \lambda x $,得:

\[x^\dagger A x = \overline{\lambda} x^\dagger x \quad \text{且} \quad x^\dagger A x = \lambda x^\dagger x \]

因此 $ \lambda x^\dagger x = \overline{\lambda} x^\dagger x $。由于 $ x \neq 0 $,内积 $ x^\dagger x = |x_1|^2 + \cdots + |x_n|^2 > 0 $,故 $ \lambda = \overline{\lambda} $,即 $ \lambda $ 为实数。

引理(不同特征值的特征向量正交)
设 $ A $ 为 Hermite 矩阵,$ \lambda \neq \mu $ 为其两个互异特征值,$ x, y $ 为对应的特征向量(\(Ax = \lambda x\), $ Ay = \mu y $),则 $ x $ 与 $ y $ 正交,即 $ x^\dagger y = 0 $。

证明
由 $ Ax = \lambda x $,两边左乘 $ y^\dagger $ 得:

\[y^\dagger A x = \lambda y^\dagger x \]

左边可改写为 $ (A y)^\dagger x $(因 $ y^\dagger A = (A y)^\dagger $),结合 $ A y = \mu y $ 及 $ \mu \in \mathbb{R} $(前一引理),得:

\[(A y)^\dagger x = (\mu y)^\dagger x = \mu y^\dagger x \]

因此 $ \mu y^\dagger x = \lambda y^\dagger x $,即 $ (\mu - \lambda) y^\dagger x = 0 $。因 $ \lambda \neq \mu $,故 $ y^\dagger x = 0 $,即 $ x $ 与 $ y $ 正交。


一般的复矩阵只能得到不同特征值对应的特征向量线性无关,而 Hermite 矩阵可以得到相互正交,这是一个更强的结论(因为正交一定线性无关)。

引理(特征向量的正交补空间是不变子空间)
设 $ A $ 为 Hermite 矩阵,$ \lambda $ 为其特征值,$ x $ 为单位特征向量($ x^\dagger x = 1 $),记 $ M = \text{span}{x} $,其正交补空间为:

\[M^\perp = \{ y \in \mathbb{C}^n \mid y^\dagger x = 0 \} \]

则 $ M^\perp $ 是 $ A $ 的不变子空间(即 $ y \in M^\perp \implies A y \in M^\perp $)。

证明
对任意 $ y \in M^\perp $,需证 $ (A y)^\dagger x = 0 $:

\[(A y)^\dagger x = y^\dagger A^\dagger x = y^\dagger A x=y^\dagger (\lambda x) = \lambda y^\dagger x = 0 \quad (\text{因 } y \in M^\perp) \]

故 $ A y \in M^\perp $,即 $ M^\perp $ 是不变子空间。

谱定理的证明

定理(Hermite 矩阵的谱定理)
对任意 $ n \times n $ Hermite 矩阵 $ A $,存在 $ n \times n $ 酉矩阵 $ U $ 和实对角矩阵 $ \Lambda $,使得:

\[U^\dagger A U = \Lambda \]

其中 $ \Lambda $ 的对角元为 $ A $ 的特征值,$ U $ 的列向量为对应的特征向量(标准正交)。

证明
用数学归纳法证明:

  • ($ n = 1 $)
    1 阶 Hermite 矩阵为实数 $ a $(满足 $ \overline{a} = a $)。取酉矩阵 $ U = [1] $,则 $ U^\dagger A U = [a] $ 为对角矩阵,结论成立。

  • (假设 $ n-1 $ 阶成立,证明 $ n $ 阶成立)
    设 $ A $ 为 $ n \times n $ Hermite 矩阵,由代数基本定理,$ A $ 存在特征值 $ \lambda_1 \in \mathbb{R} $(前一引理)和单位特征向量 $ x_1 \in \mathbb{C}^n \((\) x_1^\dagger x_1 = 1 $)。

    记 $ M = \text{span}{x_1} $,其正交补 $ M^\perp $ 为 $ n-1 $ 维子空间(由“特征向量的正交补空间是不变子空间”引理)。$ A $ 在 $ M^\perp $ 上的限制 $ A|_{M^\perp} $ 是 $ n-1 $ 阶 Hermite 矩阵(因 $ M^\perp $ 是不变子空间且 $ A^\dagger = A $)。

    由归纳假设,存在 $ n-1 $ 阶酉矩阵 $ V $(列向量为 $ M^\perp $ 的标准正交基),使得:

    \[V^\dagger (A|_{M^\perp}) V = \Lambda' \quad (\Lambda' \text{ 为 } n-1 \times n-1 \text{ 实对角矩阵}) \]

    构造 $ n \times n $ 矩阵 $ U = [x_1 \quad V'] $,其中 $ V' $ 是将 $ V $ 的列嵌入 $ \mathbb{C}^n $ 得到的矩阵(列向量属于 $ M^\perp $)。因 $ x_1 $ 与 $ V' $ 的列正交且均为单位向量,故 $ U^\dagger U = I $,即 $ U $ 是酉矩阵。

    计算 $ U^\dagger A U $:

    \[U^\dagger A U = \begin{pmatrix} x_1^\dagger \\ V'^\dagger \end{pmatrix} A \begin{pmatrix} x_1 & V' \end{pmatrix} = \begin{pmatrix} x_1^\dagger A x_1 & x_1^\dagger A V' \\ V'^\dagger A x_1 & V'^\dagger A V' \end{pmatrix} \]

    • 左上角:$ x_1^\dagger A x_1 = \lambda_1 x_1^\dagger x_1 = \lambda_1 $;
    • 右上角与左下角:因 $ A V' \subset M^\perp $,故 $ x_1^\dagger A V' = 0 $,同理 $ V'^\dagger A x_1 = 0 $;
    • 右下角:$ V'^\dagger A V' = V^\dagger (A|_{M^\perp}) V = \Lambda' $。

    因此:

    \[U^\dagger A U = \begin{pmatrix} \lambda_1 & 0 \\ 0 & \Lambda' \end{pmatrix} = \Lambda \]

    其中 $ \Lambda $ 为实对角矩阵。由归纳法,结论对所有 $ n \geq 1 $ 成立。

posted @ 2025-10-17 14:11  来者可追2019  阅读(16)  评论(0)    收藏  举报