Schur 三角化定理的推论

将学习到什么

从 Schur 的酉三角化定理可以收获一批结果,在这一部分介绍重要的几个.

 


迹与行列式

相似矩阵具有相同的特征多项式, 从特征多项式一节中, 我们又知道,相似矩阵的迹以及行列式都是相同的,且分别用所有特征值的和与积表示,所以对于矩阵 \(A\in M_n\), \(\mathrm{tr}\,A\)\(\mathrm{det}\,A\) 都可以用任何与 \(A\) 相似矩阵来计算,酉三角化中的上三角矩阵 \(T\) 的主对角线元素就是矩阵 \(A\) 的特征值,所以计算非常方便。

 

\(A\) 的多项式的特征值

假设 \(A\in M_n\) 有特征值 \(\lambda_1,\cdots\,\lambda_n\), 并设 \(p(t)\) 是一个给定的多项式,从特征值的特征向量的定理 1.1 知:对每一个 \(i=1,\cdots,n\), \(p(\lambda_i)\) 都是 \(p(A)\) 的特征值,又如果 \(\mu\)\(p(A)\) 的特征值,那么就存在某个 \(i\in \{1,\cdots,n\}\), 使得 \(\mu=p(\lambda_i)\). 这些结论给出了 \(p(A)\) 的特征值,但没有给出它们的重数,Schur 定理揭示出它们的重数.

\(A=UTU^*\), 其中 \(U\) 是酉矩阵,而 \(T=[t_{ij}]\) 是上三角矩阵,其主对角元素是 \(t_{11}=\lambda_1,t_{22}=\lambda_2,\cdots,t_{nn}=\lambda_n\). 这样就有 \(p(A)=p(UTU^*)=Up(T)U^*\), \(p(T)\) 的主对角元素是 \(p(\lambda_1),p(\lambda_2),\cdots,p(\lambda_n)\), 故而由矩阵 \(T\) 的对角元素算出 \(p(T)\) 的特征值重数. 特别地,对每个 \(k=1,\cdots\), 矩阵 \(A^k\) 的特征值是 \(\lambda_1^k,\cdots,\lambda_n^k\), 且
\begin{align}
\mathrm{tr}\, Ak=\lambda_1k+\cdots+\lambda_n^k
\end{align}
假设 \(A\in M_n\), 如果对某个正整数 \(k\)\(A^k=0\), 那么 \(\sigma(A)=\{0\}\), 所以 \(A\) 的特征多项式是 \(p_A(t)=t^n\), 其逆命题也成立,即如果 \(\sigma(A)=\{0\}\), 那么存在一个酉矩阵 \(U\) 以及一个严格上三角矩阵 \(T\), 使得 \(A=UTU^*\), 于是如下结论等价:\(A\) 是幂零的\(\Leftrightarrow A^n=0 \Leftrightarrow \sigma(A)=\{0\}\).

 

Cayley-Hamilton 定理

这个定理是说:\(p_A(t)\)\(A\) 的特征多项式,那么 \(p_A(A)=0\).
通过多项式分解和酉相似,利用归纳法可以证明. 这个定理常常被解释成每个方阵都满足它自己的特征方程,不过这需要仔细加以理解:纯量多项式 \(p_A(t)\) 首先是作为 \(p_A(t)=\mathrm{det}\, (tI-A)\) 计算的,然后才是通过代换 \(t \rightarrow A\) 来计算矩阵 \(p_A(A)\).
Cayley-Hamilton 定理的一项重要用途是将 \(A\in M_n\) 的幂 \(A^k\) (对 \(k \geqslant n\))写成 \(I,A,A^2,\cdots,A^{n-1}\) 的线性组合. 比如 \(A=\begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}\). 那么 \(p_A(t)=t^2-3t+2\), 所以 \(A^2-3A+2I=0\), 从而 \(A^2=3A-2I\),\(A^3=(3A-2I)A=3A^2-2A=3(3A-2I)-2A=7A-6I\), 类似可计算 \(A^4,A^5,\cdots\) 等等. 还可以将非奇异矩阵 \(A\) 的负次数幂表示成 \(A\)\(I\) 的线性组合,将 \(A^2-3A+2I=0\) 写成 \(I=A\Big[ \dfrac 12 (-A+3I) \Big]\), 从而 \(A^{-1}=-\dfrac 12 A+\dfrac 32 I\),同样可写出 \(A^{-2},A^{-3}\) 等等.

 

关于线性矩阵方程的 Sylvester 定理

与交换性有关的方程 \(AX-XA=0\) 是线性矩阵方程 \(AX-XB=C\) 的一个特例,通常称为Sylvester 方程.

这个定理不证明了,要了解定理中的那个充分必要条件.

 

Schur 三角化定理中的唯一性

对给定和 \(A \in M_n\)酉三角化 中定理 1.1 描述的那种可以通过酉相似得到的上三角型 \(T\) 不一定是唯一的. 也就是说,有相同主对角线的不同的上三角矩阵可能是酉相似的.
如果 \(T,T' \in M_n\) 是上三角的,且有相同的主对角线,主对角线上相同的元素归并在一起,关于使得 \(T'=WTW^*\) (也就是 \(WT=T'W\))成立的酉矩阵 \(W \in M_n\), 有什么特点?下面的定理说的是:\(W\) 必定是分块对角的,而且在关于 \(T\) 的超对角元素的某种假设之下,\(W\) 必定是对角矩阵,甚至是一个纯量矩阵,在后一种情形有 \(T=T'\).

 

每一个方阵都可以分块对角化

  **证明:** 将 $T$ 分划成 \\begin{align} T=\\begin{bmatrix} T\_{11} & Y \\\\ 0 & S\_2 \\end{bmatrix} \\notag \\end{align} 其中 $S_2=[T_{ij}]_{i,j=2}^d$. 注意 $T_{11}$ 的仅有的特征值是 $\lambda_1$, 而 $S_2$ 的特征值是 $\lambda_2,\cdots,\lambda_n$. Sylvester 定理保证了方程 $T_{11}X-XS=-Y$ 有一个解 $X$,用它来构造 \\begin{align} M=\\begin{bmatrix} I\_{n_1} & X \\\\ 0 & I \\end{bmatrix} \qquad \text{以及其逆} \qquad M^{-1}=\\begin{bmatrix} I\_{n_1} & -X \\\\ 0 & I \\end{bmatrix}\\notag \\end{align} 那么 \\begin{align} M^{-1}TM=\\begin{bmatrix} I\_{n_1} & -X \\\\ 0 & I \\end{bmatrix} \\begin{bmatrix} T\_{11} & Y \\\\ 0 & S\_2 \\end{bmatrix} \\begin{bmatrix} I\_{n_1} & X \\\\ 0 & I \\end{bmatrix}=\\begin{bmatrix} T\_{11} & T\_{11}X-XS_2+Y \\\\ 0 & S_2 \\end{bmatrix} = \\begin{bmatrix} T\_{11} & 0 \\\\ 0 & S\_2 \\end{bmatrix} \\notag \\end{align} 如果 $d=2$, 这就是所要的分块对角化. 如果 $d>2$, 重复这一化简过程来证明 $S_2$ 与 $T_{22}\oplus S_3$ 相似,其中 $S_3=[T_{ij}]_{i,j=3}^d$. 经过 $d-1$ 次化简,我们就得知 $T$ 相似于 $T_{11}\oplus \cdots\oplus T_{dd}$. 如果 $A$ 是实的且有实特征值,那么它与一个刚刚考虑过的实的分块上三角矩阵实正交相似,每一步的化简都可以用实相似来实现.

 

秩 1 摄动的特征值

  **证明:** 设 $\xi = x/ \lVert x \rVert _2$, 并令 $U=[\xi \quad u_2 \quad \cdots \quad u_n]$ 是酉矩阵. 那么由 Schur 定理知 \\begin{align} U^\*AU=\\begin{bmatrix} \lambda & \bigstar \\\\ 0 & A_1 \\end{bmatrix} \\notag \\end{align} 其中 $A_1 \in M_{n-1}$ 有特征值 $\lambda_2,\cdots,\lambda_n$. 又有 \\begin{align} U^\*xv^\*U=\\begin{bmatrix} \xi^\*x \\\\ u_2^\*x \\\\ \vdots \\\\ u_n^\*x \\end{bmatrix} v^\* U = \\begin{bmatrix} \lVert x \rVert _2 \\\\0 \\\\ \vdots \\\\ 0 \\end{bmatrix} \\begin{bmatrix}v^\*\xi & v^\*u_2 & \cdots & v^\*u_n \\end{bmatrix}=\\begin{bmatrix} \lVert x \rVert _2 v^\*\xi & \bigstar \\\\ 0 & 0 \\end{bmatrix} = \\begin{bmatrix} v^\*x & \bigstar \\\\ 0 & 0 \\end{bmatrix} \\notag \\end{align} 这样一来, \\begin{align} U^\*(A+xv^\*)U= \\begin{bmatrix}\lambda+ v^\*x & \bigstar \\\\ 0 & A_1 \\end{bmatrix} \\notag \\end{align} 就有特征值 $\lambda+v^*x,\lambda_2,\cdots,\lambda_n$.

 


应该知道什么

  • 酉三角化对于求矩阵的迹与行列式是方便的
  • \(A\) 的多项式的特征值可以通过酉相似容易辨别出来
  • 每个方阵都满足它自己的特征方程
  • 每一个方阵都可以分块对角化
  • 秩 1 摄动的特征值
posted @ 2017-11-05 16:33  小鱼吻水  阅读(5596)  评论(0编辑  收藏  举报