peiwenjun's blog 没有知识的荒原

相似标准型小结

注:本文从代数角度梳理了 Jordan 标准型相关知识,几何角度还有另一条路: 准素分解 \(\to\) 循环分解 \(\to\) Jordan 标准型,但是博主水平有限(其实就是懒),于是鸽了。

多项式矩阵

先区分两个概念:

  • 矩阵多项式:本质是关于函数的矩阵,如 \(f(A)=A^2+A-I_n\)
  • 多项式矩阵:本质是矩阵,但矩阵中的元素是多项式,如 \(\begin{pmatrix}x^2+1&x-2\\1&0\\\end{pmatrix}\)

如果多项式矩阵以 \(\lambda\) 作为变量,我们也可以称为 \(\lambda-\)矩阵 。

\(\lambda-\)矩阵的运算与数字矩阵基本相同,但以下两个概念需要区分:

  • \(A(\lambda)\) 满秩 \(\iff |A(\lambda)|\neq 0\)
  • \(A(\lambda)\) 可逆 \(\iff\exist B(\lambda)\) 使得 \(A(\lambda)B(\lambda)=B(\lambda)A(\lambda)=I_n\iff |A(\lambda)|\in\mathbb F/\{0\}\)

数字矩阵运算中满秩和可逆是两个等价的概念,\(\lambda\) -矩阵满秩不一定可逆,如 \(\begin{pmatrix}\lambda&0\\0&1\\\end{pmatrix}\) ,这是因为它的行列式是关于 \(\lambda\) 的多项式而非常数。

初等 \(\lambda-\)矩阵变换:

  • 交换两行(列)。
  • 将某行(列)乘上非零常数 \(c\)
  • 将某行(列)的 \(f(\lambda)\) 倍加到另一行(列)。

注:为保证初等变换矩阵可逆,第二类初等变换要求 \(c\) 是常数而不能是关于 \(\lambda\) 的多项式。

定理: \(A\)\(B\) 相似 \(\iff\lambda I_n-A\)\(\lambda I_n-B\) 等价。

由于证明比较复杂,此处略去。

\(\texttt{Smith}\) 标准型

\(A_{m\times n}(\lambda)\) 的秩为 \(r\) ,则 \(\exist\) 首一多项式 \(d_i(\lambda)\) 使得 \(A(\lambda)\)\(\text{diag}(d_1(\lambda),\cdots,d_r(\lambda),0,\cdots,0)\) 等价,并且 \(d_i(\lambda)\mid d_{i+1}(\lambda)\)

证明考虑通过辗转相除得到 \(a_{i,j}(\lambda)\) 的最大公因式,通过交换操作放到 \(a_{1,1}(\lambda)\) 的位置上,用它消去第一行第一列的其他元素,即可化归到低阶情形。

上述对角阵称为 \(A(\lambda)\)\(\texttt{Smith}\) 标准型,由此可知每个多项式矩阵都与它(唯一的)\(\texttt{Smith}\) 标准型等价。

注:求 \(\texttt{Smith}\) 标准型的过程其实非常痛苦,首先为了能够辗转相除需要用到大量交换操作,其次辗转相除的过程会进行很多次多项式运算。

行列式因子与不变因子

定义

行列式因子:\(D_i(\lambda)\)\(A(\lambda)\) 所有 \(i\) 阶子式的最大公因式,则称 \(\{D_1(\lambda),\cdots,D_r(\lambda)\}\)\(A(\lambda)\) 的行列式因子。

不变因子:\(d_1(\lambda)=D_1(\lambda)\)\(d_i(\lambda)=\frac{D_i(\lambda)}{D_{i-1}(\lambda)}\) ,则称 \(\{d_1(\lambda),\cdots,d_r(\lambda)\}\)\(A(\lambda)\) 的不变因子。

注:行列式因子和不变因子均不可随意调换顺序

性质

在不引起歧义的情况下,对数字矩阵 \(A\) ,我们称 \(A\) 的行列式因子和不变因子为 \(\lambda I_n-A\) 的行列式因子和不变因子。

\(\deg |\lambda I_n-A|=n\) 可知 \(\lambda I_n-A\) 满秩,因此 \(A\) 的行列式因子和不变因子个数均为 \(n\)

对数字矩阵 \(A\)

  • \(\deg D_n(\lambda)=n\)

  • \(\sum_{i=1}^n\deg d_i(\lambda)=n\)

  • \(D_n(\lambda)\)\(A\) 的特征多项式, \(d_n(\lambda)\)\(A\) 的极小多项式。

    证明会在讲到 \(\texttt{Frobenius}\) 标准型时给出。

以下是对一般 \(\lambda-\)矩阵都成立的性质:

  • \(D_i(\lambda)\mid D_{i+1}(\lambda)\)

    这是因为任意一个 \(i+1\) 阶子式可以按行展开成若干个 \(i\) 阶子式的线性组合。

  • 矩阵的 \(\texttt{Smith}\) 标准型、行列式因子、不变因子相互唯一确定。

    只需注意到三类初等变换均不改变行列式因子,然后就很显然了。

  • \(d_i(\lambda)\mid d_{i+1}(\lambda)\)

    这是因为在 \(\texttt{Smith}\) 标准型中,第 \(i\) 个对角元素就是第 \(i\) 个不变因子。

  • \(A(\lambda)\)\(B(\lambda)\) 等价 \(\iff A(\lambda),B(\lambda)\) 有相同不变因子/行列式因子。

    这是因为 \(A(\lambda),B(\lambda)\) 都与(同一个) \(\texttt{Smith}\) 标准型等价。

    直接推论: \(A,B\) 相似 \(\iff A,B\) 有相同不变因子/行列式因子,这是数字矩阵相似的完全不变量!

求法

多数题目只需考虑三阶矩阵,此时 \(D_1(\lambda)=1,D_3(\lambda)=|\lambda I_n-A|\)

\(D_2(\lambda)\) 必须是 \(1\) 或一次多项式,挑 \(3\sim 4\) 个二阶子式(总共有 \(9\) 个,但没必要全算一遍)看它们是否有公因式即可。

求出行列式因子后,不变因子也就呼之欲出了。

例:\(A=\begin{bmatrix}0&1&1\\0&1&0\\-1&1&2\\\end{bmatrix}\) ,求 \(A\) 的行列式因子和不变因子。

解:

\(\lambda E-A=\begin{bmatrix}\lambda&-1&-1\\0&\lambda-1&0\\1&-1&\lambda-2\\\end{bmatrix}\),则 \(D_1(\lambda)=1,D_3(\lambda)=(\lambda-1)^3\)

注意到包含第二行的二阶子式一定能被 \(\lambda-1\) 整除,计算由第一、三行组成的 \(3\) 个二阶子式可知 \(D_2(\lambda)=\lambda-1\)

进而 \(d_1(\lambda)=1,d_2(\lambda)=\lambda-1,d_3(\lambda)=(\lambda-1)^2\)

\(n\) 阶矩阵 \(A\) ,要么 \(A\) 中有大量的 \(0\) ,从而 \(A\) 有大量子式为 \(0\) 且剩余部分非常好算;要么能找到两个互素的 \(n-1\) 阶子式,从而 \(D_1(\lambda)=\cdots=D_{n-1}(\lambda)=1,D_n(\lambda)=|\lambda I_n-A|\)

Frobenius 标准型 / 有理标准型

\(r\) 次首一多项式 \(f(\lambda)=\lambda^r+a_1\lambda^{r-1}+\cdots+a_r\) ,称以下 \(r\) 阶方阵为 Frobenius 块

\[F=\begin{bmatrix} 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&1\\ -a_r&-a_{r-1}&-a_{r-2}&\cdots&-a_1\\ \end{bmatrix}\\ \]

\(F\) 的行列式因子和不变因子均为 \(1,1,\cdots,f(\lambda)\) ,且 \(m_F(\lambda)=f(\lambda)\)

证明:

取第 \(1\sim r-1\) 行、 \(2\sim r\) 列,则 \(D_{r-1}(\lambda)=1\) ,因此 \(i\le r-1\) 时有 \(D_i(\lambda)=1\)

\(\varphi\) 在基 \(\{e_1,\cdots,e_r\}\) 下的表示矩阵为 \(F^T\) ,则:

\[\varphi(e_1)=e_2\\ \vdots\\ \varphi(e_{r-1})=e_r\\ \varphi(e_r)=\sum_{i=1}^r-a_{r+1-i}e_i\\ \]

因此 \(e_i=\varphi^{i-1}(e_1)\) ,为证 \(f(F^T)=0\) ,只需对 \(\forall e_i\) 证明 \(f(\varphi)[e_i]=0\)

\[\begin{aligned} f(\varphi)[e_i]&=\varphi^r(e_i)+\sum_{i=1}^ra_i\cdot\varphi^{r-i}(e_i)\\ &=\varphi^{i-1}(\varphi^r(e_1)+\sum_{i=1}^ra_i\cdot\varphi^{r-i}(e_1))\\ &=\varphi^{i-1}(\varphi(e_r)+\sum_{i=1}^ra_i\cdot e_{r-i+1})\\ &=\varphi^{i-1}(0)=0\\ \end{aligned} \]

\(\deg g\le r-1\) ,由 \(e_i\) 线性无关知 \(g(\varphi)[e_1]\neq 0\) ,综上 \(m_F(\lambda)=m_{F^T}(\lambda)=0\)


定理:若 \(A\) 的不变因子为 \(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda)\) ,则 \(A\)\(F=\text{diag}(F_1,\cdots,F_k)\) 相似,其中 \(F_i\)\(d_i(\lambda)\) 对应的 Frobenius 块(也可记为 \(F(d_i)\) ),称 \(F\)\(A\) 的 Frobenius 标准型或有理标准型。

证明:

\[\lambda I_n-F\sim\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,1,\cdots,1,d_k(\lambda))\sim\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda))\\ \]

因此 \(F\)\(A\) 有相同不变因子,从而两者相似。


定理: \(A\) 的极小多项式是最后一个不变因子。

证明:由 \(d_i(\lambda)\mid d_{i+1}(\lambda)\) ,可知 \(d_k(\lambda)\) 可将每个 Frobenius 块零化,从而是 \(A\) 的零化多项式;另一方面,次数比 \(d_k(\lambda)\) 低的多项式均无法将 \(F_k\) 零化,因此 \(d_k(\lambda)\)\(A\) 的极小多项式。

初等因子

将不变因子拆成若干 \(f_i(\lambda)^{k_i}\) 的乘积,则这些 \(f_i(\lambda)^{k_i}\) 构成初等因子(组)。

例:不变因子为 \(\{1,1,\lambda-1,(\lambda-1)^2(\lambda-2)\}\) ,则初等因子为 \(\{\lambda-1,(\lambda-1)^2,\lambda-2\}\)

注意事项:

  • 不变因子不能随意调换顺序,但初等因子可以。

  • 初等因子和数域息息相关,比如 \(\lambda^2-2\) 在有理数域上不能拆,但实数域上要拆成 \(\lambda-\sqrt 2,\lambda+\sqrt 2\)\(\lambda^2+1\) 在有理数域和实数域上不能拆,但复数域上要拆成 \(\lambda+i\)\(\lambda-i\)

  • \(A(\lambda),B(\lambda)\) 相似 \(\iff\) \(A(\lambda),B(\lambda)\) 有相同的秩和相同的初等因子。

    \(A,B\) 相似 \(\iff A,B\) 有相同的初等因子。

    前者是因为矩阵的秩决定了要补多少个 \(1\) ,后者是因为 \(|\lambda I_n-A|\) 的秩一定为 \(n\)


通过不变因子求初等因子是容易的,那反过来通过初等因子如何求不变因子?

把初等因子按照 \(f_i(\lambda)\) 归类,每一类按 \(k_i\) 降序排序,然后依次分给 \(d_n(\lambda),d_{n-1}(\lambda),\cdots\) ,直到分完为止。

例:初等因子为 \(\{\lambda-1,\lambda-2,(\lambda-1)^2,(\lambda-1)^2,(\lambda-2)^2\}\) ,则 \(d_8(\lambda)=(\lambda-1)^2(\lambda-2)^2,d_7(\lambda)=(\lambda-1)^2(\lambda-2),d_6(\lambda)=\lambda-1\) ,其余为 \(1\)


定理:\(A\) 可对角化 \(\iff A\) 的极小多项式无重根 \(\iff A\) 的初等因子均为 \(1\) 次式。

证明:

\((1)\to(2)\) :设 \(P^{-1}AP=D=\text{diag}(\lambda_1,\cdots,\lambda_n)\) ,则 \(m(\lambda)\) 为本质不同的 \(\lambda-\lambda_i\) 的乘积,无重根。

\((2)\to(3)\) :根据初等因子的定义显然。

\((3)\to(1)\)\(A\) 的 Jordan 标准型即为对角阵。

Jordan 标准型

定义

Jordan 标准型要求 \(f_i(\lambda)\) 全为一次式,因此仅对复数域成立

对初等因子 \((\lambda-k)^m\) ,记下述矩阵为 Jordan 块:

\[J_m(k)=\begin{bmatrix} k&1&0&\cdots&0\\ 0&k&1&\cdots&0\\ \vdots&\vdots&\ddots&\ddots&\vdots\\ \vdots&\vdots&\vdots&\ddots&1\\ 0&0&0&0&k\\ \end{bmatrix}_m\\ \]

\(A\) 的初等因子组为 \(\{(\lambda-\lambda_1)^{r_1},\cdots,(\lambda-\lambda_k)^{r_k}\}\) ,记 \(J=\text{diag}(J_{r_1}(\lambda_1),\cdots,J_{r_k}(\lambda_k))\)\(A\) 的 Jordan 标准型。

注:分块对角矩阵 \(\text{diag}(A,B)\)\(\text{diag}(B,A)\) 相似,不同的 Jordan 块排列顺序无要求。


定理: \(A\)\(J\) 相似。

证明:

【引理】记 \(d(\lambda)=\gcd(f(\lambda),g(\lambda)),m(\lambda)=\text{lcm}(f(\lambda),g(\lambda))\) ,则 \(\text{diag}(f(\lambda),g(\lambda))\)\(\text{diag}(d(\lambda),m(\lambda))\) 等价。

【证明】用裴蜀定理配合三类初等变换即可。

回到原题,只需证 \(\lambda E-A\)\(\lambda E-J\) 等价。

注意到 \(\lambda E-J_m(k)\)\(\text{diag}(1,\cdots,1,(\lambda-k)^m)\) 有相同不变因子,因此二者相似,结合引理可知 \(\lambda E-J\)\(\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda))\) 相似,得证。

性质

  • \(\lambda\) 的代数重数 \(=\) 属于 \(\lambda\) 的 Jordan 块阶数之和。
  • \(\lambda\) 的几何重数 \(=\) 属于 \(\lambda\) 的 Jordan 块个数。
  • \(r(A)=n-(0\) 的几何重数 \()\)

证明:相似矩阵有相同的代数重数、几何重数、秩,从 Jordan 标准型中可以直接读出上述信息。

求法

\(\text{Q1}\) :如何求 Jordan 标准型?

常规做法:行列式因子 \(\to\) 不变因子 \(\to\) 初等因子 \(\to\) Jordan 标准型,可行但很麻烦。

取巧做法:其实也可以先求每个特征值的代数重数 \(x\) 和几何重数 \(y\) ,然后反推初等因子。但这个做法要求 \(x-y\le 1\)\(y=1\) 或初等因子次数 \(\le 2\) (要保证能推出来)。比如 \(x=3,y=1\) 则初等因子为 \((\lambda-\lambda_0)^3\)\(x=3,y=2\) 则初等因子为 \(\lambda-\lambda_0,(\lambda-\lambda_0)^2\)

本方法对 \(n=3\) 保证有效(更高阶则不一定),但针对该问题优化并不明显,针对下面的问题可以省去求不变因子的步骤。

\(\text{Q2}\) :如何求可逆阵 \(P\) 使得 \(P^{-1}AP=J\)

注:烦请读者自行了解广义特征向量的基本概念。

\(P=\begin{bmatrix}\alpha_1&\cdots&\alpha_n\end{bmatrix}\) ,通过 \(AP=PJ\) 可以列出方程组,每个方程形如 \((A-\lambda)\alpha_i=0\)\(\alpha_{i-1}\) (即广义特征向量链),然后逐层求解直到无解即可,最后别忘了将链长和 Jordan 块大小一一对应。(比如某一特征值 \(\lambda\) 有一个 \(3\) 阶 Jordan 块和一个 \(2\) 阶 Jordan 块,那么一定会求出一条长为 \(3\) 的广义特征向量链和一条长为 \(2\) 的广义特征向量链,对应顺序不能错)。

例: \(A=\begin{bmatrix}1&-2&0&2\\-3&-1&1&2\\0&-7&1&7\\-3&-2&1&3\\\end{bmatrix}\) ,求 \(J\)\(P\)

解:

\(|\lambda E-A|=(\lambda-1)^4\) ,因此 \(A\) 仅有特征值 \(1\)

\((E-A)\cdot\overrightarrow x=0\) ,得 \(\alpha_1=(1,0,3,0)^T,\alpha_2=(0,1,0,1)^T\)

\((E-A)\cdot\overrightarrow x=\alpha_1\) ,无解。

\((E-A)\cdot\overrightarrow x=\alpha_2\) ,得 \(\alpha_3=(u,v,1+3u,v)^T\) ,其中 \(u,v\) 待定。

\((E-A)\cdot\overrightarrow x=\alpha_3\) ,为保证 \(\alpha_4\) 有解,取 \(\alpha_3=(2,0,7,0)^T\) ,此时 \(\alpha_4=(-2,0,0,1)^T\)

因此 \(\alpha_1\) 对应一个 \(1\) 阶 Jordan 块, \(\alpha_4\to\alpha_3\to\alpha_2\) 对应一个 \(3\) 阶 Jordan 块。

\[J=\begin{bmatrix} 1&0&0&0\\ 0&1&1&0\\ 0&0&1&1\\ 0&0&0&1\\ \end{bmatrix} \quad P=\begin{bmatrix} 1&0&2&0\\ 0&1&0&0\\ 3&0&7&-2\\ 0&1&0&1\\ \end{bmatrix}\\ \]

应用

Jordan-Chevalley 分解:对复数域上的任意矩阵 \(A\) ,存在唯一的分解 \(A=B+C\) 满足:① \(B\) 可对角化 ② \(C\) 是幂零矩阵 ③ \(B,C\) 可交换 ④ \(B,C\) 均可表示为关于 \(A\) 的多项式。并且满足条件 ①②③ 的矩阵唯一。

证明:

对 Jordan 标准型 \(J\) ,设极小多项式为 \(\prod_{i=1}^s(\lambda-\lambda_i)^{m_i}\) ,由中国剩余定理,存在 \(g(\lambda)\) 满足 \(g(\lambda)=h_i(\lambda-\lambda_i)^{m_i}+\lambda_i\)

\(D\) 为主对角线, \(N\) 为次对角线,则条件①②③容易验证。

对于属于特征值 \(\lambda_i\) 的 Jordan 块 \(J_k\)\(g(J_k)=h_i(J_i-\lambda_iE)^{m_i}+\lambda_iE=\lambda_iE\) ,因此 \(D=g(J),N=J-g(J)\) ,④成立。

对任意矩阵 \(A=PJP^{-1}\) ,取 \(B=PDP^{-1},C=PNP^{-1}\) 即可。

接下来证明唯一性,若 \((B,C)\)\((B',C')\) 满足条件,由 ④ 知 \(B,B'\) 可交换, \(C,C'\) 可交换,由二项式定理知 \(B'-B=C-C'\) 为幂零矩阵。由于可交换的可对角化矩阵一定可以同步对角化(想一想,为什么?),因此对角阵 \(D-D'\) 是幂零矩阵,即 \(D=D'\) ,进而 \(B=B',C=C'\)


如果知道 \(P,D,N\) ,那么我们可以将 \(\mathcal O(n^3\log k)\) 的矩阵快速幂优化到 \(\mathcal O(n^3+n\log k)\) 。(但是显然求 \(P\) 才是难点

posted on 2025-03-31 08:16  peiwenjun  阅读(241)  评论(0)    收藏  举报

导航