相似标准型小结

注：本文从代数角度梳理了 Jordan 标准型相关知识，几何角度还有另一条路：准素分解 \(\to\) 循环分解 \(\to\) Jordan 标准型，但是博主水平有限（~~其实就是懒~~），于是鸽了。

多项式矩阵

先区分两个概念：

矩阵多项式：本质是关于函数的矩阵，如 \(f(A)=A^2+A-I_n\) 。
多项式矩阵：本质是矩阵，但矩阵中的元素是多项式，如 \(\begin{pmatrix}x^2+1&x-2\\1&0\\\end{pmatrix}\) 。

如果多项式矩阵以 \(\lambda\) 作为变量，我们也可以称为 \(\lambda-\)矩阵。

\(\lambda-\)矩阵的运算与数字矩阵基本相同，但以下两个概念需要区分：

\(A(\lambda)\) 满秩 \(\iff |A(\lambda)|\neq 0\) 。
\(A(\lambda)\) 可逆 \(\iff\exist B(\lambda)\) 使得 \(A(\lambda)B(\lambda)=B(\lambda)A(\lambda)=I_n\iff |A(\lambda)|\in\mathbb F/\{0\}\) 。

数字矩阵运算中满秩和可逆是两个等价的概念，但 \(\lambda\) -矩阵满秩不一定可逆，如 \(\begin{pmatrix}\lambda&0\\0&1\\\end{pmatrix}\) ，这是因为它的行列式是关于 \(\lambda\) 的多项式而非常数。

初等 \(\lambda-\)矩阵变换：

交换两行（列）。
将某行（列）乘上非零常数 \(c\) 。
将某行（列）的 \(f(\lambda)\) 倍加到另一行（列）。

注：为保证初等变换矩阵可逆，第二类初等变换要求 \(c\) 是常数而不能是关于 \(\lambda\) 的多项式。

定理： \(A\) 与 \(B\) 相似 \(\iff\lambda I_n-A\) 与 \(\lambda I_n-B\) 等价。

由于证明比较复杂，此处略去。

\(\texttt{Smith}\) 标准型

若 \(A_{m\times n}(\lambda)\) 的秩为 \(r\) ，则 \(\exist\) 首一多项式 \(d_i(\lambda)\) 使得 \(A(\lambda)\) 与 \(\text{diag}(d_1(\lambda),\cdots,d_r(\lambda),0,\cdots,0)\) 等价，并且 \(d_i(\lambda)\mid d_{i+1}(\lambda)\) 。

证明考虑通过辗转相除得到 \(a_{i,j}(\lambda)\) 的最大公因式，通过交换操作放到 \(a_{1,1}(\lambda)\) 的位置上，用它消去第一行第一列的其他元素，即可化归到低阶情形。

上述对角阵称为 \(A(\lambda)\) 的 \(\texttt{Smith}\) 标准型，由此可知每个多项式矩阵都与它（唯一的）\(\texttt{Smith}\) 标准型等价。

注：求 \(\texttt{Smith}\) 标准型的过程其实非常痛苦，首先为了能够辗转相除需要用到大量交换操作，其次辗转相除的过程会进行很多次多项式运算。

行列式因子与不变因子

定义

行列式因子：\(D_i(\lambda)\) 为 \(A(\lambda)\) 所有 \(i\) 阶子式的最大公因式，则称 \(\{D_1(\lambda),\cdots,D_r(\lambda)\}\) 为 \(A(\lambda)\) 的行列式因子。

不变因子：\(d_1(\lambda)=D_1(\lambda)\) ， \(d_i(\lambda)=\frac{D_i(\lambda)}{D_{i-1}(\lambda)}\) ，则称 \(\{d_1(\lambda),\cdots,d_r(\lambda)\}\) 为 \(A(\lambda)\) 的不变因子。

注：行列式因子和不变因子均不可随意调换顺序。

性质

在不引起歧义的情况下，对数字矩阵 \(A\) ，我们称 \(A\) 的行列式因子和不变因子为 \(\lambda I_n-A\) 的行列式因子和不变因子。

由 \(\deg |\lambda I_n-A|=n\) 可知 \(\lambda I_n-A\) 满秩，因此 \(A\) 的行列式因子和不变因子个数均为 \(n\) 。

对数字矩阵 \(A\) ：

\(\deg D_n(\lambda)=n\) 。
\(\sum_{i=1}^n\deg d_i(\lambda)=n\) 。
\(D_n(\lambda)\) 为 \(A\) 的特征多项式， \(d_n(\lambda)\) 为 \(A\) 的极小多项式。

证明会在讲到 \(\texttt{Frobenius}\) 标准型时给出。

以下是对一般 \(\lambda-\)矩阵都成立的性质：

\(D_i(\lambda)\mid D_{i+1}(\lambda)\) 。

这是因为任意一个 \(i+1\) 阶子式可以按行展开成若干个 \(i\) 阶子式的线性组合。
矩阵的 \(\texttt{Smith}\) 标准型、行列式因子、不变因子相互唯一确定。

只需注意到三类初等变换均不改变行列式因子，然后就很显然了。
\(d_i(\lambda)\mid d_{i+1}(\lambda)\) 。

这是因为在 \(\texttt{Smith}\) 标准型中，第 \(i\) 个对角元素就是第 \(i\) 个不变因子。
\(A(\lambda)\) 与 \(B(\lambda)\) 等价 \(\iff A(\lambda),B(\lambda)\) 有相同不变因子/行列式因子。

这是因为 \(A(\lambda),B(\lambda)\) 都与（同一个） \(\texttt{Smith}\) 标准型等价。

直接推论： \(A,B\) 相似 \(\iff A,B\) 有相同不变因子/行列式因子，这是数字矩阵相似的完全不变量！

求法

多数题目只需考虑三阶矩阵，此时 \(D_1(\lambda)=1,D_3(\lambda)=|\lambda I_n-A|\) 。

\(D_2(\lambda)\) 必须是 \(1\) 或一次多项式，挑 \(3\sim 4\) 个二阶子式（总共有 \(9\) 个，但没必要全算一遍）看它们是否有公因式即可。

求出行列式因子后，不变因子也就呼之欲出了。

例：\(A=\begin{bmatrix}0&1&1\\0&1&0\\-1&1&2\\\end{bmatrix}\) ，求 \(A\) 的行列式因子和不变因子。

解：

\(\lambda E-A=\begin{bmatrix}\lambda&-1&-1\\0&\lambda-1&0\\1&-1&\lambda-2\\\end{bmatrix}\)，则 \(D_1(\lambda)=1,D_3(\lambda)=(\lambda-1)^3\) 。

注意到包含第二行的二阶子式一定能被 \(\lambda-1\) 整除，计算由第一、三行组成的 \(3\) 个二阶子式可知 \(D_2(\lambda)=\lambda-1\) 。

进而 \(d_1(\lambda)=1,d_2(\lambda)=\lambda-1,d_3(\lambda)=(\lambda-1)^2\) 。

对 \(n\) 阶矩阵 \(A\) ，要么 \(A\) 中有大量的 \(0\) ，从而 \(A\) 有大量子式为 \(0\) 且剩余部分非常好算；要么能找到两个互素的 \(n-1\) 阶子式，从而 \(D_1(\lambda)=\cdots=D_{n-1}(\lambda)=1,D_n(\lambda)=|\lambda I_n-A|\) 。

Frobenius 标准型 / 有理标准型

对 \(r\) 次首一多项式 \(f(\lambda)=\lambda^r+a_1\lambda^{r-1}+\cdots+a_r\) ，称以下 \(r\) 阶方阵为 Frobenius 块：

\[F=\begin{bmatrix} 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&1\\ -a_r&-a_{r-1}&-a_{r-2}&\cdots&-a_1\\ \end{bmatrix}\\ \]

则 \(F\) 的行列式因子和不变因子均为 \(1,1,\cdots,f(\lambda)\) ，且 \(m_F(\lambda)=f(\lambda)\) 。

证明：

取第 \(1\sim r-1\) 行、 \(2\sim r\) 列，则 \(D_{r-1}(\lambda)=1\) ，因此 \(i\le r-1\) 时有 \(D_i(\lambda)=1\) 。

设 \(\varphi\) 在基 \(\{e_1,\cdots,e_r\}\) 下的表示矩阵为 \(F^T\) ，则：

\[\varphi(e_1)=e_2\\ \vdots\\ \varphi(e_{r-1})=e_r\\ \varphi(e_r)=\sum_{i=1}^r-a_{r+1-i}e_i\\ \]

因此 \(e_i=\varphi^{i-1}(e_1)\) ，为证 \(f(F^T)=0\) ，只需对 \(\forall e_i\) 证明 \(f(\varphi)[e_i]=0\) ：

\[\begin{aligned} f(\varphi)[e_i]&=\varphi^r(e_i)+\sum_{i=1}^ra_i\cdot\varphi^{r-i}(e_i)\\ &=\varphi^{i-1}(\varphi^r(e_1)+\sum_{i=1}^ra_i\cdot\varphi^{r-i}(e_1))\\ &=\varphi^{i-1}(\varphi(e_r)+\sum_{i=1}^ra_i\cdot e_{r-i+1})\\ &=\varphi^{i-1}(0)=0\\ \end{aligned} \]

对 \(\deg g\le r-1\) ，由 \(e_i\) 线性无关知 \(g(\varphi)[e_1]\neq 0\) ，综上 \(m_F(\lambda)=m_{F^T}(\lambda)=0\) 。

定理：若 \(A\) 的不变因子为 \(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda)\) ，则 \(A\) 与 \(F=\text{diag}(F_1,\cdots,F_k)\) 相似，其中 \(F_i\) 为 \(d_i(\lambda)\) 对应的 Frobenius 块（也可记为 \(F(d_i)\) ），称 \(F\) 为 \(A\) 的 Frobenius 标准型或有理标准型。

证明：

\[\lambda I_n-F\sim\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,1,\cdots,1,d_k(\lambda))\sim\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda))\\ \]

因此 \(F\) 与 \(A\) 有相同不变因子，从而两者相似。

定理： \(A\) 的极小多项式是最后一个不变因子。

证明：由 \(d_i(\lambda)\mid d_{i+1}(\lambda)\) ，可知 \(d_k(\lambda)\) 可将每个 Frobenius 块零化，从而是 \(A\) 的零化多项式；另一方面，次数比 \(d_k(\lambda)\) 低的多项式均无法将 \(F_k\) 零化，因此 \(d_k(\lambda)\) 是 \(A\) 的极小多项式。

初等因子

将不变因子拆成若干 \(f_i(\lambda)^{k_i}\) 的乘积，则这些 \(f_i(\lambda)^{k_i}\) 构成初等因子（组）。

例：不变因子为 \(\{1,1,\lambda-1,(\lambda-1)^2(\lambda-2)\}\) ，则初等因子为 \(\{\lambda-1,(\lambda-1)^2,\lambda-2\}\) 。

注意事项：

不变因子不能随意调换顺序，但初等因子可以。
初等因子和数域息息相关，比如 \(\lambda^2-2\) 在有理数域上不能拆，但实数域上要拆成 \(\lambda-\sqrt 2,\lambda+\sqrt 2\) ； \(\lambda^2+1\) 在有理数域和实数域上不能拆，但复数域上要拆成 \(\lambda+i\) 和 \(\lambda-i\) 。
\(A(\lambda),B(\lambda)\) 相似 \(\iff\) \(A(\lambda),B(\lambda)\) 有相同的秩和相同的初等因子。

\(A,B\) 相似 \(\iff A,B\) 有相同的初等因子。

前者是因为矩阵的秩决定了要补多少个 \(1\) ，后者是因为 \(|\lambda I_n-A|\) 的秩一定为 \(n\) 。

通过不变因子求初等因子是容易的，那反过来通过初等因子如何求不变因子？

把初等因子按照 \(f_i(\lambda)\) 归类，每一类按 \(k_i\) 降序排序，然后依次分给 \(d_n(\lambda),d_{n-1}(\lambda),\cdots\) ，直到分完为止。

例：初等因子为 \(\{\lambda-1,\lambda-2,(\lambda-1)^2,(\lambda-1)^2,(\lambda-2)^2\}\) ，则 \(d_8(\lambda)=(\lambda-1)^2(\lambda-2)^2,d_7(\lambda)=(\lambda-1)^2(\lambda-2),d_6(\lambda)=\lambda-1\) ，其余为 \(1\) 。

定理：\(A\) 可对角化 \(\iff A\) 的极小多项式无重根 \(\iff A\) 的初等因子均为 \(1\) 次式。

证明：

\((1)\to(2)\) ：设 \(P^{-1}AP=D=\text{diag}(\lambda_1,\cdots,\lambda_n)\) ，则 \(m(\lambda)\) 为本质不同的 \(\lambda-\lambda_i\) 的乘积，无重根。

\((2)\to(3)\) ：根据初等因子的定义显然。

\((3)\to(1)\) ： \(A\) 的 Jordan 标准型即为对角阵。

Jordan 标准型

定义

Jordan 标准型要求 \(f_i(\lambda)\) 全为一次式，因此仅对复数域成立。

对初等因子 \((\lambda-k)^m\) ，记下述矩阵为 Jordan 块：

\[J_m(k)=\begin{bmatrix} k&1&0&\cdots&0\\ 0&k&1&\cdots&0\\ \vdots&\vdots&\ddots&\ddots&\vdots\\ \vdots&\vdots&\vdots&\ddots&1\\ 0&0&0&0&k\\ \end{bmatrix}_m\\ \]

若 \(A\) 的初等因子组为 \(\{(\lambda-\lambda_1)^{r_1},\cdots,(\lambda-\lambda_k)^{r_k}\}\) ，记 \(J=\text{diag}(J_{r_1}(\lambda_1),\cdots,J_{r_k}(\lambda_k))\) 为 \(A\) 的 Jordan 标准型。

注：分块对角矩阵 \(\text{diag}(A,B)\) 和 \(\text{diag}(B,A)\) 相似，不同的 Jordan 块排列顺序无要求。

定理： \(A\) 与 \(J\) 相似。

证明：

【引理】记 \(d(\lambda)=\gcd(f(\lambda),g(\lambda)),m(\lambda)=\text{lcm}(f(\lambda),g(\lambda))\) ，则 \(\text{diag}(f(\lambda),g(\lambda))\) 与 \(\text{diag}(d(\lambda),m(\lambda))\) 等价。

【证明】用裴蜀定理配合三类初等变换即可。

回到原题，只需证 \(\lambda E-A\) 与 \(\lambda E-J\) 等价。

注意到 \(\lambda E-J_m(k)\) 与 \(\text{diag}(1,\cdots,1,(\lambda-k)^m)\) 有相同不变因子，因此二者相似，结合引理可知 \(\lambda E-J\) 与 \(\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda))\) 相似，得证。

性质

\(\lambda\) 的代数重数 \(=\) 属于 \(\lambda\) 的 Jordan 块阶数之和。
\(\lambda\) 的几何重数 \(=\) 属于 \(\lambda\) 的 Jordan 块个数。
\(r(A)=n-(0\) 的几何重数 \()\) 。

证明：相似矩阵有相同的代数重数、几何重数、秩，从 Jordan 标准型中可以直接读出上述信息。

求法

\(\text{Q1}\) ：如何求 Jordan 标准型？

常规做法：行列式因子 \(\to\) 不变因子 \(\to\) 初等因子 \(\to\) Jordan 标准型，可行但很麻烦。

取巧做法：其实也可以先求每个特征值的代数重数 \(x\) 和几何重数 \(y\) ，然后反推初等因子。但这个做法要求 \(x-y\le 1\) 或 \(y=1\) 或初等因子次数 \(\le 2\) （要保证能推出来）。比如 \(x=3,y=1\) 则初等因子为 \((\lambda-\lambda_0)^3\) ， \(x=3,y=2\) 则初等因子为 \(\lambda-\lambda_0,(\lambda-\lambda_0)^2\) 。

本方法对 \(n=3\) 保证有效（更高阶则不一定），但针对该问题优化并不明显，针对下面的问题可以省去求不变因子的步骤。

\(\text{Q2}\) ：如何求可逆阵 \(P\) 使得 \(P^{-1}AP=J\) ？

注：烦请读者自行了解广义特征向量的基本概念。

设 \(P=\begin{bmatrix}\alpha_1&\cdots&\alpha_n\end{bmatrix}\) ，通过 \(AP=PJ\) 可以列出方程组，每个方程形如 \((A-\lambda)\alpha_i=0\) 或 \(\alpha_{i-1}\) （即广义特征向量链），然后逐层求解直到无解即可，最后别忘了将链长和 Jordan 块大小一一对应。（比如某一特征值 \(\lambda\) 有一个 \(3\) 阶 Jordan 块和一个 \(2\) 阶 Jordan 块，那么一定会求出一条长为 \(3\) 的广义特征向量链和一条长为 \(2\) 的广义特征向量链，对应顺序不能错）。

例： \(A=\begin{bmatrix}1&-2&0&2\\-3&-1&1&2\\0&-7&1&7\\-3&-2&1&3\\\end{bmatrix}\) ，求 \(J\) 和 \(P\) 。

解：

\(|\lambda E-A|=(\lambda-1)^4\) ，因此 \(A\) 仅有特征值 \(1\) 。

令 \((E-A)\cdot\overrightarrow x=0\) ，得 \(\alpha_1=(1,0,3,0)^T,\alpha_2=(0,1,0,1)^T\) 。

令 \((E-A)\cdot\overrightarrow x=\alpha_1\) ，无解。

令 \((E-A)\cdot\overrightarrow x=\alpha_2\) ，得 \(\alpha_3=(u,v,1+3u,v)^T\) ，其中 \(u,v\) 待定。

令 \((E-A)\cdot\overrightarrow x=\alpha_3\) ，为保证 \(\alpha_4\) 有解，取 \(\alpha_3=(2,0,7,0)^T\) ，此时 \(\alpha_4=(-2,0,0,1)^T\) 。

因此 \(\alpha_1\) 对应一个 \(1\) 阶 Jordan 块， \(\alpha_4\to\alpha_3\to\alpha_2\) 对应一个 \(3\) 阶 Jordan 块。

\[J=\begin{bmatrix} 1&0&0&0\\ 0&1&1&0\\ 0&0&1&1\\ 0&0&0&1\\ \end{bmatrix} \quad P=\begin{bmatrix} 1&0&2&0\\ 0&1&0&0\\ 3&0&7&-2\\ 0&1&0&1\\ \end{bmatrix}\\ \]

应用

Jordan-Chevalley 分解：对复数域上的任意矩阵 \(A\) ，存在唯一的分解 \(A=B+C\) 满足：① \(B\) 可对角化 ② \(C\) 是幂零矩阵 ③ \(B,C\) 可交换 ④ \(B,C\) 均可表示为关于 \(A\) 的多项式。并且满足条件 ①②③ 的矩阵唯一。

证明：

对 Jordan 标准型 \(J\) ，设极小多项式为 \(\prod_{i=1}^s(\lambda-\lambda_i)^{m_i}\) ，由中国剩余定理，存在 \(g(\lambda)\) 满足 \(g(\lambda)=h_i(\lambda-\lambda_i)^{m_i}+\lambda_i\) 。

取 \(D\) 为主对角线， \(N\) 为次对角线，则条件①②③容易验证。

对于属于特征值 \(\lambda_i\) 的 Jordan 块 \(J_k\) ， \(g(J_k)=h_i(J_i-\lambda_iE)^{m_i}+\lambda_iE=\lambda_iE\) ，因此 \(D=g(J),N=J-g(J)\) ，④成立。

对任意矩阵 \(A=PJP^{-1}\) ，取 \(B=PDP^{-1},C=PNP^{-1}\) 即可。

接下来证明唯一性，若 \((B,C)\) 和 \((B',C')\) 满足条件，由 ④ 知 \(B,B'\) 可交换， \(C,C'\) 可交换，由二项式定理知 \(B'-B=C-C'\) 为幂零矩阵。由于可交换的可对角化矩阵一定可以同步对角化（想一想，为什么？），因此对角阵 \(D-D'\) 是幂零矩阵，即 \(D=D'\) ，进而 \(B=B',C=C'\) 。

如果知道 \(P,D,N\) ，那么我们可以将 \(\mathcal O(n^3\log k)\) 的矩阵快速幂优化到 \(\mathcal O(n^3+n\log k)\) 。（~~但是显然求 \(P\) 才是难点~~）

posted on 2025-03-31 08:16 peiwenjun 阅读(289) 评论(0) 收藏举报

刷新页面返回顶部