相似标准型小结
注:本文从代数角度梳理了 Jordan 标准型相关知识,几何角度还有另一条路: 准素分解 \(\to\) 循环分解 \(\to\) Jordan 标准型,但是博主水平有限(
其实就是懒),于是鸽了。
多项式矩阵
先区分两个概念:
- 矩阵多项式:本质是关于函数的矩阵,如 \(f(A)=A^2+A-I_n\) 。
- 多项式矩阵:本质是矩阵,但矩阵中的元素是多项式,如 \(\begin{pmatrix}x^2+1&x-2\\1&0\\\end{pmatrix}\) 。
如果多项式矩阵以 \(\lambda\) 作为变量,我们也可以称为 \(\lambda-\)矩阵 。
\(\lambda-\)矩阵的运算与数字矩阵基本相同,但以下两个概念需要区分:
- \(A(\lambda)\) 满秩 \(\iff |A(\lambda)|\neq 0\) 。
- \(A(\lambda)\) 可逆 \(\iff\exist B(\lambda)\) 使得 \(A(\lambda)B(\lambda)=B(\lambda)A(\lambda)=I_n\iff |A(\lambda)|\in\mathbb F/\{0\}\) 。
数字矩阵运算中满秩和可逆是两个等价的概念,但 \(\lambda\) -矩阵满秩不一定可逆,如 \(\begin{pmatrix}\lambda&0\\0&1\\\end{pmatrix}\) ,这是因为它的行列式是关于 \(\lambda\) 的多项式而非常数。
初等 \(\lambda-\)矩阵变换:
- 交换两行(列)。
- 将某行(列)乘上非零常数 \(c\) 。
- 将某行(列)的 \(f(\lambda)\) 倍加到另一行(列)。
注:为保证初等变换矩阵可逆,第二类初等变换要求 \(c\) 是常数而不能是关于 \(\lambda\) 的多项式。
定理: \(A\) 与 \(B\) 相似 \(\iff\lambda I_n-A\) 与 \(\lambda I_n-B\) 等价。
由于证明比较复杂,此处略去。
\(\texttt{Smith}\) 标准型
若 \(A_{m\times n}(\lambda)\) 的秩为 \(r\) ,则 \(\exist\) 首一多项式 \(d_i(\lambda)\) 使得 \(A(\lambda)\) 与 \(\text{diag}(d_1(\lambda),\cdots,d_r(\lambda),0,\cdots,0)\) 等价,并且 \(d_i(\lambda)\mid d_{i+1}(\lambda)\) 。
证明考虑通过辗转相除得到 \(a_{i,j}(\lambda)\) 的最大公因式,通过交换操作放到 \(a_{1,1}(\lambda)\) 的位置上,用它消去第一行第一列的其他元素,即可化归到低阶情形。
上述对角阵称为 \(A(\lambda)\) 的 \(\texttt{Smith}\) 标准型,由此可知每个多项式矩阵都与它(唯一的)\(\texttt{Smith}\) 标准型等价。
注:求 \(\texttt{Smith}\) 标准型的过程其实非常痛苦,首先为了能够辗转相除需要用到大量交换操作,其次辗转相除的过程会进行很多次多项式运算。
行列式因子与不变因子
定义
行列式因子:\(D_i(\lambda)\) 为 \(A(\lambda)\) 所有 \(i\) 阶子式的最大公因式,则称 \(\{D_1(\lambda),\cdots,D_r(\lambda)\}\) 为 \(A(\lambda)\) 的行列式因子。
不变因子:\(d_1(\lambda)=D_1(\lambda)\) , \(d_i(\lambda)=\frac{D_i(\lambda)}{D_{i-1}(\lambda)}\) ,则称 \(\{d_1(\lambda),\cdots,d_r(\lambda)\}\) 为 \(A(\lambda)\) 的不变因子。
注:行列式因子和不变因子均不可随意调换顺序。
性质
在不引起歧义的情况下,对数字矩阵 \(A\) ,我们称 \(A\) 的行列式因子和不变因子为 \(\lambda I_n-A\) 的行列式因子和不变因子。
由 \(\deg |\lambda I_n-A|=n\) 可知 \(\lambda I_n-A\) 满秩,因此 \(A\) 的行列式因子和不变因子个数均为 \(n\) 。
对数字矩阵 \(A\) :
-
\(\deg D_n(\lambda)=n\) 。
-
\(\sum_{i=1}^n\deg d_i(\lambda)=n\) 。
-
\(D_n(\lambda)\) 为 \(A\) 的特征多项式, \(d_n(\lambda)\) 为 \(A\) 的极小多项式。
证明会在讲到 \(\texttt{Frobenius}\) 标准型时给出。
以下是对一般 \(\lambda-\)矩阵都成立的性质:
-
\(D_i(\lambda)\mid D_{i+1}(\lambda)\) 。
这是因为任意一个 \(i+1\) 阶子式可以按行展开成若干个 \(i\) 阶子式的线性组合。
-
矩阵的 \(\texttt{Smith}\) 标准型、行列式因子、不变因子相互唯一确定。
只需注意到三类初等变换均不改变行列式因子,然后就很显然了。
-
\(d_i(\lambda)\mid d_{i+1}(\lambda)\) 。
这是因为在 \(\texttt{Smith}\) 标准型中,第 \(i\) 个对角元素就是第 \(i\) 个不变因子。
-
\(A(\lambda)\) 与 \(B(\lambda)\) 等价 \(\iff A(\lambda),B(\lambda)\) 有相同不变因子/行列式因子。
这是因为 \(A(\lambda),B(\lambda)\) 都与(同一个) \(\texttt{Smith}\) 标准型等价。
直接推论: \(A,B\) 相似 \(\iff A,B\) 有相同不变因子/行列式因子,这是数字矩阵相似的完全不变量!
求法
多数题目只需考虑三阶矩阵,此时 \(D_1(\lambda)=1,D_3(\lambda)=|\lambda I_n-A|\) 。
\(D_2(\lambda)\) 必须是 \(1\) 或一次多项式,挑 \(3\sim 4\) 个二阶子式(总共有 \(9\) 个,但没必要全算一遍)看它们是否有公因式即可。
求出行列式因子后,不变因子也就呼之欲出了。
例:\(A=\begin{bmatrix}0&1&1\\0&1&0\\-1&1&2\\\end{bmatrix}\) ,求 \(A\) 的行列式因子和不变因子。
解:
\(\lambda E-A=\begin{bmatrix}\lambda&-1&-1\\0&\lambda-1&0\\1&-1&\lambda-2\\\end{bmatrix}\),则 \(D_1(\lambda)=1,D_3(\lambda)=(\lambda-1)^3\) 。
注意到包含第二行的二阶子式一定能被 \(\lambda-1\) 整除,计算由第一、三行组成的 \(3\) 个二阶子式可知 \(D_2(\lambda)=\lambda-1\) 。
进而 \(d_1(\lambda)=1,d_2(\lambda)=\lambda-1,d_3(\lambda)=(\lambda-1)^2\) 。
对 \(n\) 阶矩阵 \(A\) ,要么 \(A\) 中有大量的 \(0\) ,从而 \(A\) 有大量子式为 \(0\) 且剩余部分非常好算;要么能找到两个互素的 \(n-1\) 阶子式,从而 \(D_1(\lambda)=\cdots=D_{n-1}(\lambda)=1,D_n(\lambda)=|\lambda I_n-A|\) 。
Frobenius 标准型 / 有理标准型
对 \(r\) 次首一多项式 \(f(\lambda)=\lambda^r+a_1\lambda^{r-1}+\cdots+a_r\) ,称以下 \(r\) 阶方阵为 Frobenius 块:
则 \(F\) 的行列式因子和不变因子均为 \(1,1,\cdots,f(\lambda)\) ,且 \(m_F(\lambda)=f(\lambda)\) 。
证明:
取第 \(1\sim r-1\) 行、 \(2\sim r\) 列,则 \(D_{r-1}(\lambda)=1\) ,因此 \(i\le r-1\) 时有 \(D_i(\lambda)=1\) 。
设 \(\varphi\) 在基 \(\{e_1,\cdots,e_r\}\) 下的表示矩阵为 \(F^T\) ,则:
因此 \(e_i=\varphi^{i-1}(e_1)\) ,为证 \(f(F^T)=0\) ,只需对 \(\forall e_i\) 证明 \(f(\varphi)[e_i]=0\) :
对 \(\deg g\le r-1\) ,由 \(e_i\) 线性无关知 \(g(\varphi)[e_1]\neq 0\) ,综上 \(m_F(\lambda)=m_{F^T}(\lambda)=0\) 。
定理:若 \(A\) 的不变因子为 \(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda)\) ,则 \(A\) 与 \(F=\text{diag}(F_1,\cdots,F_k)\) 相似,其中 \(F_i\) 为 \(d_i(\lambda)\) 对应的 Frobenius 块(也可记为 \(F(d_i)\) ),称 \(F\) 为 \(A\) 的 Frobenius 标准型或有理标准型。
证明:
因此 \(F\) 与 \(A\) 有相同不变因子,从而两者相似。
定理: \(A\) 的极小多项式是最后一个不变因子。
证明:由 \(d_i(\lambda)\mid d_{i+1}(\lambda)\) ,可知 \(d_k(\lambda)\) 可将每个 Frobenius 块零化,从而是 \(A\) 的零化多项式;另一方面,次数比 \(d_k(\lambda)\) 低的多项式均无法将 \(F_k\) 零化,因此 \(d_k(\lambda)\) 是 \(A\) 的极小多项式。
初等因子
将不变因子拆成若干 \(f_i(\lambda)^{k_i}\) 的乘积,则这些 \(f_i(\lambda)^{k_i}\) 构成初等因子(组)。
例:不变因子为 \(\{1,1,\lambda-1,(\lambda-1)^2(\lambda-2)\}\) ,则初等因子为 \(\{\lambda-1,(\lambda-1)^2,\lambda-2\}\) 。
注意事项:
-
不变因子不能随意调换顺序,但初等因子可以。
-
初等因子和数域息息相关,比如 \(\lambda^2-2\) 在有理数域上不能拆,但实数域上要拆成 \(\lambda-\sqrt 2,\lambda+\sqrt 2\) ; \(\lambda^2+1\) 在有理数域和实数域上不能拆,但复数域上要拆成 \(\lambda+i\) 和 \(\lambda-i\) 。
-
\(A(\lambda),B(\lambda)\) 相似 \(\iff\) \(A(\lambda),B(\lambda)\) 有相同的秩和相同的初等因子。
\(A,B\) 相似 \(\iff A,B\) 有相同的初等因子。
前者是因为矩阵的秩决定了要补多少个 \(1\) ,后者是因为 \(|\lambda I_n-A|\) 的秩一定为 \(n\) 。
通过不变因子求初等因子是容易的,那反过来通过初等因子如何求不变因子?
把初等因子按照 \(f_i(\lambda)\) 归类,每一类按 \(k_i\) 降序排序,然后依次分给 \(d_n(\lambda),d_{n-1}(\lambda),\cdots\) ,直到分完为止。
例:初等因子为 \(\{\lambda-1,\lambda-2,(\lambda-1)^2,(\lambda-1)^2,(\lambda-2)^2\}\) ,则 \(d_8(\lambda)=(\lambda-1)^2(\lambda-2)^2,d_7(\lambda)=(\lambda-1)^2(\lambda-2),d_6(\lambda)=\lambda-1\) ,其余为 \(1\) 。
定理:\(A\) 可对角化 \(\iff A\) 的极小多项式无重根 \(\iff A\) 的初等因子均为 \(1\) 次式。
证明:
\((1)\to(2)\) :设 \(P^{-1}AP=D=\text{diag}(\lambda_1,\cdots,\lambda_n)\) ,则 \(m(\lambda)\) 为本质不同的 \(\lambda-\lambda_i\) 的乘积,无重根。
\((2)\to(3)\) :根据初等因子的定义显然。
\((3)\to(1)\) : \(A\) 的 Jordan 标准型即为对角阵。
Jordan 标准型
定义
Jordan 标准型要求 \(f_i(\lambda)\) 全为一次式,因此仅对复数域成立。
对初等因子 \((\lambda-k)^m\) ,记下述矩阵为 Jordan 块:
若 \(A\) 的初等因子组为 \(\{(\lambda-\lambda_1)^{r_1},\cdots,(\lambda-\lambda_k)^{r_k}\}\) ,记 \(J=\text{diag}(J_{r_1}(\lambda_1),\cdots,J_{r_k}(\lambda_k))\) 为 \(A\) 的 Jordan 标准型。
注:分块对角矩阵 \(\text{diag}(A,B)\) 和 \(\text{diag}(B,A)\) 相似,不同的 Jordan 块排列顺序无要求。
定理: \(A\) 与 \(J\) 相似。
证明:
【引理】记 \(d(\lambda)=\gcd(f(\lambda),g(\lambda)),m(\lambda)=\text{lcm}(f(\lambda),g(\lambda))\) ,则 \(\text{diag}(f(\lambda),g(\lambda))\) 与 \(\text{diag}(d(\lambda),m(\lambda))\) 等价。
【证明】用裴蜀定理配合三类初等变换即可。
回到原题,只需证 \(\lambda E-A\) 与 \(\lambda E-J\) 等价。
注意到 \(\lambda E-J_m(k)\) 与 \(\text{diag}(1,\cdots,1,(\lambda-k)^m)\) 有相同不变因子,因此二者相似,结合引理可知 \(\lambda E-J\) 与 \(\text{diag}(1,\cdots,1,d_1(\lambda),\cdots,d_k(\lambda))\) 相似,得证。
性质
- \(\lambda\) 的代数重数 \(=\) 属于 \(\lambda\) 的 Jordan 块阶数之和。
- \(\lambda\) 的几何重数 \(=\) 属于 \(\lambda\) 的 Jordan 块个数。
- \(r(A)=n-(0\) 的几何重数 \()\) 。
证明:相似矩阵有相同的代数重数、几何重数、秩,从 Jordan 标准型中可以直接读出上述信息。
求法
\(\text{Q1}\) :如何求 Jordan 标准型?
常规做法:行列式因子 \(\to\) 不变因子 \(\to\) 初等因子 \(\to\) Jordan 标准型,可行但很麻烦。
取巧做法:其实也可以先求每个特征值的代数重数 \(x\) 和几何重数 \(y\) ,然后反推初等因子。但这个做法要求 \(x-y\le 1\) 或 \(y=1\) 或初等因子次数 \(\le 2\) (要保证能推出来)。比如 \(x=3,y=1\) 则初等因子为 \((\lambda-\lambda_0)^3\) , \(x=3,y=2\) 则初等因子为 \(\lambda-\lambda_0,(\lambda-\lambda_0)^2\) 。
本方法对 \(n=3\) 保证有效(更高阶则不一定),但针对该问题优化并不明显,针对下面的问题可以省去求不变因子的步骤。
\(\text{Q2}\) :如何求可逆阵 \(P\) 使得 \(P^{-1}AP=J\) ?
注:烦请读者自行了解广义特征向量的基本概念。
设 \(P=\begin{bmatrix}\alpha_1&\cdots&\alpha_n\end{bmatrix}\) ,通过 \(AP=PJ\) 可以列出方程组,每个方程形如 \((A-\lambda)\alpha_i=0\) 或 \(\alpha_{i-1}\) (即广义特征向量链),然后逐层求解直到无解即可,最后别忘了将链长和 Jordan 块大小一一对应。(比如某一特征值 \(\lambda\) 有一个 \(3\) 阶 Jordan 块和一个 \(2\) 阶 Jordan 块,那么一定会求出一条长为 \(3\) 的广义特征向量链和一条长为 \(2\) 的广义特征向量链,对应顺序不能错)。
例: \(A=\begin{bmatrix}1&-2&0&2\\-3&-1&1&2\\0&-7&1&7\\-3&-2&1&3\\\end{bmatrix}\) ,求 \(J\) 和 \(P\) 。
解:
\(|\lambda E-A|=(\lambda-1)^4\) ,因此 \(A\) 仅有特征值 \(1\) 。
令 \((E-A)\cdot\overrightarrow x=0\) ,得 \(\alpha_1=(1,0,3,0)^T,\alpha_2=(0,1,0,1)^T\) 。
令 \((E-A)\cdot\overrightarrow x=\alpha_1\) ,无解。
令 \((E-A)\cdot\overrightarrow x=\alpha_2\) ,得 \(\alpha_3=(u,v,1+3u,v)^T\) ,其中 \(u,v\) 待定。
令 \((E-A)\cdot\overrightarrow x=\alpha_3\) ,为保证 \(\alpha_4\) 有解,取 \(\alpha_3=(2,0,7,0)^T\) ,此时 \(\alpha_4=(-2,0,0,1)^T\) 。
因此 \(\alpha_1\) 对应一个 \(1\) 阶 Jordan 块, \(\alpha_4\to\alpha_3\to\alpha_2\) 对应一个 \(3\) 阶 Jordan 块。
\[J=\begin{bmatrix} 1&0&0&0\\ 0&1&1&0\\ 0&0&1&1\\ 0&0&0&1\\ \end{bmatrix} \quad P=\begin{bmatrix} 1&0&2&0\\ 0&1&0&0\\ 3&0&7&-2\\ 0&1&0&1\\ \end{bmatrix}\\ \]
应用
Jordan-Chevalley 分解:对复数域上的任意矩阵 \(A\) ,存在唯一的分解 \(A=B+C\) 满足:① \(B\) 可对角化 ② \(C\) 是幂零矩阵 ③ \(B,C\) 可交换 ④ \(B,C\) 均可表示为关于 \(A\) 的多项式。并且满足条件 ①②③ 的矩阵唯一。
证明:
对 Jordan 标准型 \(J\) ,设极小多项式为 \(\prod_{i=1}^s(\lambda-\lambda_i)^{m_i}\) ,由中国剩余定理,存在 \(g(\lambda)\) 满足 \(g(\lambda)=h_i(\lambda-\lambda_i)^{m_i}+\lambda_i\) 。
取 \(D\) 为主对角线, \(N\) 为次对角线,则条件①②③容易验证。
对于属于特征值 \(\lambda_i\) 的 Jordan 块 \(J_k\) , \(g(J_k)=h_i(J_i-\lambda_iE)^{m_i}+\lambda_iE=\lambda_iE\) ,因此 \(D=g(J),N=J-g(J)\) ,④成立。
对任意矩阵 \(A=PJP^{-1}\) ,取 \(B=PDP^{-1},C=PNP^{-1}\) 即可。
接下来证明唯一性,若 \((B,C)\) 和 \((B',C')\) 满足条件,由 ④ 知 \(B,B'\) 可交换, \(C,C'\) 可交换,由二项式定理知 \(B'-B=C-C'\) 为幂零矩阵。由于可交换的可对角化矩阵一定可以同步对角化(想一想,为什么?),因此对角阵 \(D-D'\) 是幂零矩阵,即 \(D=D'\) ,进而 \(B=B',C=C'\) 。
如果知道 \(P,D,N\) ,那么我们可以将 \(\mathcal O(n^3\log k)\) 的矩阵快速幂优化到 \(\mathcal O(n^3+n\log k)\) 。(但是显然求 \(P\) 才是难点)
本文来自博客园,作者:peiwenjun,转载请注明原文链接:https://www.cnblogs.com/peiwenjun/p/18801470
浙公网安备 33010602011771号