高代二上半学习笔记
\(V\) 为关于 \(\mathbb F\) 的 \(n\) 维线性空间.
高代一
记得 \(r(A^*)=\begin{cases} n&r(A)=n\\ 1&r(A)=n-1\\ 0&r(A)\le n-2\\ \end{cases}\) 和 \(AA^*=|A|I_n\) 即可.
确定了一个基 \(\mathcal T\in V^n\) 后,可以构造 \(\mathcal L(V)\) 到 \(M_n(\mathbb F)\)一个双射 \(T_{\mathcal T}\),即将线性变换映射到其表示矩阵.也可以构造 \(V\) 与 \(\mathbb F^n\) 的一个双射 \(L_{\mathcal T}\),即将向量映射到其坐标.
如果再确定一个基 \(\mathcal S\in V^n\),同样也可以构造 \(\mathcal L(V)\) 到 \(M_n(\mathbb F)\) 一个双射 \(T_{\mathcal S}\) 和 \(V\) 到 \(\mathbb F^n\) 的一个双射 \(L_{\mathcal S}\).
设 \(\mathcal T\) 到 \(\mathcal S\) 的过渡矩阵为可逆矩阵 \(P_{\mathcal T\to\mathcal S}\),即 \(\mathcal S=\mathcal TP_{\mathcal T\to\mathcal S}\).
则对任意向量 \(v\in V\) 有:
根据基的性质 \(L_{\mathcal T}(v)=P_{\mathcal T\to\mathcal S}L_{\mathcal S}(v)\).
考虑任意线性变换 \(\phi\in\mathcal L(V)\) 与向量 \(e\in V\),有 \(L_{\mathcal T}(\phi(e))=T_{\mathcal T}(\phi)L_{\mathcal T}(e)\) 和 \(L_{\mathcal S}(\phi(e))=T_{\mathcal S}(\phi)L_{\mathcal S}(e)\).所以:
然后 \(L_{\mathcal S}(v)\) 是任意的,所以 \(T_{\mathcal S}(\phi)=P_{\mathcal T\to\mathcal S}^{-1}T_{\mathcal T}(\phi)P_{\mathcal T\to\mathcal S}\).
多项式
对于任意多项式 \(f,g\in\mathbb F[x]\),若 \(g\neq0\),则存在唯一商式 \(p\in\mathbb F[x]\) 和余式 \(q\in\mathbb F[x]\),满足 \(f=gp+q\) 且 \(\dim q<\dim g\).
若 \((f,g)=1\),则存在 \(p,q\in\mathbb F[x]\) 满足 \(fp+gq=1\).
根的个数小于等于其次数,任意复多项式均取等.
多项式矩阵
多项式矩阵即 \(M_n(\mathbb F[x])\),矩阵多项式即 \((M_n(\mathbb F))[x]\),二者之间存在双射.
考虑多项式矩阵 \(A\in M_n(\mathbb F[x])\),现在这是个环了,考虑有什么性质还保留.
可以对它求行列式和子式,定义秩为最大非零子式阶数.
相抵标准型
可以对它进行初等行变换:
- 交换两行.
- 将一行乘以一个非零 \(\mathbb F\) 中数.
- 将一行乘一个 \(\mathbb F[x]\) 中多项式加到另一行上.
这样可以保证操作可逆,于是有三类初等矩阵多项式.同理还有初等列变换.称经过初等变换得到的矩阵和原矩阵相抵,是个等价关系.
通过初等变换,可以把所有元素和左上角的元素辗转相除使得左上角的元素为所有元素的因式,再利用它把首行首列消到只剩它一个,不断归纳到只剩一个保持整除偏序的对角线,再全部首一化就能得到 Smith 标准型.
可以证明初等变换不改变秩,所以秩就是 Smith 标准型中非零对角线元素数量,行列式和 Smith 标准型中非零对角线元素的积差一个非零常倍数.而且可依此证:
逆
还可以定义伴随矩阵 \(A^*\),仍然有:
可以进行矩阵乘法,于是可以定义逆 \(A^{-1}\):
所以 \(|A||A^{-1}|=1\),这意味着可逆时 \(|A|\in\mathbb F-\{0\}\).
并且 \(|A|\in\mathbb F-\{0\}\) 时 \(\frac{A^*}{|A|}\) 是逆元,所以这是可逆充要条件.
因子
所有对于一个 \(k\),取出所有 \(k\) 阶子式,再求 \(\gcd\),就是 \(k\) 阶行列式因子 \(D_k(A)\).由于所有 \(k-1\) 阶子式都是一个 \(k\) 阶子式的因式,所以它们在整除偏序下是递增的.
行列式因子在三个初等变换下不变,所以变到 Smith 标准型后,他的对角线是行列式因子.而行列式因子唯一,所以一个矩阵的 Smith 标准型唯一.
求行列式因子的除法差分可得不变因子.不变因子就是 Smith 标准型的对角线上的元素,所以它们还满足整除偏序.再把不变因子进行唯一分解,得到的多项式叫作初等因子.
反过来,如果知道了秩和初等因子即可唯一推出不变因子,不变因子做个前缀乘能唯一得到行列式因子,所以它们三个是等价的.
相似
对于任意线性变换,随便取一个基都可以得到一个表示矩阵.把同一个线性变换能得到的矩阵归为一类,称为相似类.
对于任意两个矩阵 \(A,B\in M_n(\mathbb F)\).它们若能出现在一个相似类内,则存在一个可逆矩阵 \(P\in M_n(\mathbb F)\) 满足 \(B=P^{-1}AP\),而这也是充分的.此时称它们相似,记作 \(A\sim B\).
相似是等价关系,而每个等价类就是一个相似类.
接下来是一堆相似不变量.
行列式
迹
秩
特征向量
对于一个矩阵 \(A\in M_n(\mathbb F)\),非零向量 \(x\in V-\{0\}\) 和数 \(\lambda\in\mathcal L(V)\),若 \(Ax=\lambda x\),则称 \(\lambda\) 为 \(A\) 的特征值,称 \(x\) 为 \(A\) 关于 \(\lambda\) 的特征向量.
所以 \(P^{-1}x\) 是 \(B\) 关于 \(\lambda\) 的特征向量.
特征多项式
当 \(\lambda\) 为 \(A\) 的特征值时,\(Ax=\lambda x\) 即齐次线性方程组 \((\lambda I_n-A)x=0\) 有非零解,所以 \(\lambda I_n-A\) 不满秩,继而需满足 \(|\lambda I_n-A|=0\).这也是充分的.
考虑多项式矩阵的行列式 \(|xI_n-A|\),它的根就是 \(A\) 的特征值.记 \(A\) 的特征多项式 \(c_A(x)=|xI_n-A|\),则它是一个首一的 \(n\) 次多项式.
第 \(n-i\) 项系数为所有 \(i\) 阶主子式之和的 \((-1)^i\) 倍.所以常数项是行列式.
重数
把所有关于它的特征向量再加上 \(0\) 构成了一个线性空间,称为关于 \(\lambda\) 的特征子空间 \(V_\lambda\),称 \(\dim V_\lambda\) 为 \(\lambda\) 的几何重数.这是一个相似不变量,因为 \(A\) 的特征向量和 \(B\) 的特征向量是线性同构的.
对于 \(A\) 的任意一个特征值 \(\lambda\),其代数重数即作为特征多项式的根时的重数,所以和特征多项式一样也是一个相似不变量.
取一个 \(V_\lambda\) 的基 \(\alpha_0,\alpha_1,\cdots,\alpha_{\dim V_\lambda-1}\),将其扩充为 \(V\) 的一个基 \(\alpha_0,\alpha_1,\cdots,\alpha_{n-1}\),那么在此基下的表示矩阵是一个 \(\begin{pmatrix} \lambda I_{\dim V_\lambda}&*\\ 0&*\\ \end{pmatrix}\),继而其特征多项式里必然有一个 \((x-\lambda)^{\dim V_\lambda}\) 的因式,也就是几何重数 \(\dim V_\lambda\) 不大于代数重数.
可对角化
\(n\) 次多项式的根不超过 \(n\) 个,所以代数重数之和肯定不超过 \(n\).
等于 \(n\) 时,设 \(\lambda\) 的一个特征向量为 \(\alpha_0\),再将其扩充为 \(V\) 的一个基 \(\alpha_0,\alpha_1,\cdots,\alpha_{n-1}\),那么在此基下的表示矩阵为 \(\begin{pmatrix} \lambda&*\\ 0&*\\ \end{pmatrix}\).对右下角的矩阵归纳一下即可证明它与一个上三角矩阵相似.此时这个上三角矩阵的对角线都是特征值,且重数为代数重数.
这里称它为可上三角化.由于上三角矩阵均满足代数重数之和等于 \(n\),所以这是可上三角化的充要条件.可上三角化时特征多项式是若干个一次多项式的积.
此时矩阵的迹等于所有特征值之和,即特征多项式 \(n-1\) 次项系数的相反数.
设有 \(m\) 个特征值 \(\lambda_0,\lambda_1,\cdots,\lambda_{m-1}\),考虑归纳证明 \(\bigoplus\limits_{i=0}^{m-1}V_{\lambda_i}=\sum\limits_{i=0}^{m-1}V_{\lambda_i}\).
对任意 \(\alpha_k\in V_{\lambda_k}\cap\sum\limits_{i=0}^{k-1}V_{\lambda_i}\),存在 \(\alpha_0\in V_{\lambda_0},\alpha_1\in V_{\lambda_1},\cdots,\alpha_{k-1}\in V_{\lambda_{k-1}}\) 使得 \(\alpha_k=\sum\limits_{i=0}^{k-1}\alpha_i\),故有:
于是乎 \(\sum\limits_{i=0}^{k-1}(\lambda_i-\lambda_k)\alpha_i=0\).根据归纳假设就知道 \(\alpha_0,\alpha_1,\cdots,\alpha_{k-1}\) 线性无关,所以 \(\alpha_k=0\).
就有了 \(\bigoplus\limits_{i=0}^{m-1}V_{\lambda_i}=\sum\limits_{i=0}^{m-1}V_{\lambda_i}\subset V\),继而 \(\sum\limits_{i=0}^{m-1}\dim V_{\lambda_i}\le\dim V=n\),还可以选出 \(\sum\limits_{i=0}^{m-1}\dim V_{\lambda_i}\) 个线性无关的特征向量.所以几何重数之和不大于 \(n\).
等于 \(n\) 时,这个直和就是 \(V\),称为特征空间完备.可以选出来 \(n\) 个线性无关的特征向量 \(\alpha_0,\alpha_1,\cdots,\alpha_{n-1}\).在此基下的表示矩阵是一个对角矩阵,所以它和一个对角矩阵相似,而且对角上的元素都是特征值.
倒过来推.可对角化时,设有 \(P=(\alpha_0,\alpha_1,\cdots,\alpha_{n-1})\) 对角化得到 \(\Lambda=\operatorname{diag}(\lambda'_0,\lambda'_1,\cdots,\lambda'_{n-1})\),于是有:
所以 \(\forall i\in[0,n)\cap\mathbb N.A\alpha_i=\lambda'_i\alpha_i\),这意味着 \(\alpha_i\) 是关于特征值的 \(\lambda'_i\) 的特征向量.而且 \(P\) 可逆所以这 \(n\) 个特征向量线性无关,继而此时几何重数之和等于 \(n\).也就是特征空间完备.
所以可对角化和特征空间完备的充要条件.
谱分解
可对角化时有一个由特征向量组成的 \(P=(\alpha_0,\alpha_1,\cdots,\alpha_{n-1})\),同时也有一个逆矩阵 \(P^{-1}=\begin{pmatrix} \beta_0\\ \beta_1\\ \vdots\\ \beta_{n-1}\\ \end{pmatrix}\),考虑:
考虑 \(\forall k\in[0,m)\cap\mathbb N\) 设 \(S_k=\{i\in[0,n)\cap\mathbb N,\lambda'_i=\lambda_k\}\) 即把 \(\lambda_k\) 对应位置取出来.设 \(A_k=\sum\limits_{i\in S_k}\alpha_i\beta_j\) 就有:
这就叫谱分解.考虑:
所以 \(\beta_l\alpha_r=[l=r]\),故:
所以每个 \(A_k\) 都是幂等矩阵且两两正交.
多项式扩域
多项式 \(\mathbb F[x]\) 中变元可以做到 \(x\in M_n(\mathbb F)\).因为是同矩阵,所以乘法可交换,也就是说 \(\mathbb F[A]=\{f(A)\mid f(x)\in\mathbb F[x]\}\) 是一个交换环.
注意 \((P^{-1}AP)^n=\prod\limits_{i=0}^{n-1}(P^{-1}AP)=P^{-1}\prod\limits_{i=0}^{n-2}(APP^{-1})AP=P^{-1}A^nP\),中间的全部抵消了.
对于三个多项式 \(f(x),p(x),q(x)\in\mathbb F[x]\),若有 \(f(x)=p(x)q(x),(p(x),q(x))=1\),则利用 \(p'(x)p(x)+q'(x)q(x)=1\) 可得,对任意矩阵 \(A\in M_n(\mathbb F)\) 有 \(\ker f(A)=\ker p(A)\oplus\ker q(A)\).扩展到多个多项式时也一样.
对于一个多项式 \(f(x)\in\mathbb F[x]\),一个特征值 \(\lambda\in\mathbb F\) 和特征向量 \(x\in\mathbb F^n\),有 \(f(A)x=\sum\limits_{i=0}^{n-1}a_iA^nx=\sum\limits_{i=0}^{n-1}a_i\lambda^nx=f(\lambda)x\),所以 \(f(\lambda)\) 是 \(f(A)\) 的特征向量且几何重数不减.
如果 \(A\) 是上三角阵,则 \(f(A')\) 也是上三角阵,且对角线上的元素是 \(A\) 对应元素在 \(f\) 处的取值.
多项式适合
若 \(f(A)=0\),则称 \(A\) 适合 \(f\).此时所有特征值 \(\lambda\) 都满足 \(f(\lambda)\) 是 \(0\) 的特征向量,也就是 \(f(\lambda)=0\).
此时若有 \(f(x)=\prod\limits_{i=0}^{s-1}p_i(x)\) 且 \(p_0(x),p_1,\cdots,p_{s-1}(x)\) 两两互质,则 \(\bigoplus\limits_{i=0}^{s-1}\ker p_i(A)=\ker f(A)=\ker0=V\).
幂零矩阵适合 \(f(x)=x^n\),所以它的特征值都是 \(0\).注意如果可上三角化那么反之也成立.
幂等矩阵适合 \(f(x)=x^2-x\),所以它的特征值为 \(0\) 或 \(1\).如果可上三角化那么 \(1\) 的数量就是秩数.
对合矩阵适合 \(f(x)=x^2-1\),所以它的特征值为 \(-1\) 或 \(1\).如果可上三角化那么迹和 \(n\) 的奇偶性相同.
极小多项式
设 \(m_A(x)\) 为 \(A\) 适合的非零的次数最小的非零首一多项式.因为 \(M_n(\mathbb F)\) 是 \(n^2\) 次线性空间,所以 一个 \(I,A,A^2\cdots,A^{n^2}\) 必然线性相关,所以这个多项式是必然存在的.而如果有多个,那么差也以 \(A\) 为零点但次数更小,所以不可能.故这是良定义.
对于所有以 \(A\) 为零点的次数最小的非零首一多项式 \(F(x)\),它模 \(m_A(x)\) 得到的一定也以 \(A\) 为零点,而次数比 \(m_A(x)\) 小,所以只能为 \(0\).故 \(F(x)\) 必为 \(m_A(x)\) 的倍式.
考虑 \(\mathbb F[A]\),有 \(I_n,A,A^2,\cdots,A^{\deg m(\lambda)-1}\) 线性无关,而且 \(A^{\deg m(\lambda)}\) 可以被它们线性表出,所以做个多项式除法即可得到 \(\dim\mathbb F[A]=\deg m(\lambda)\).
当 \(c_A(x)\) 为多项式时,我们有 \(c_A(A)=0\),这叫 Carley-Hamilton 定理.证明可以 \(c_A(A)=|AI-A|=0\),但是后面那个等号需要伴随矩阵让它正常一点.
设 \(A=(a_{ij})\),以 \(M_n(\mathbb F)\) 为域,考虑:
而我们有:
所以:
左乘上伴随矩阵,令:
则:
\(d\) 和 \(c_A(A)\) 两个行列式互为转置,所以 \(c_A(A)=d=0\).
于是在 \(x\in M_n(\mathbb F)\) 下时 \(m_A(x)\mid c_A(x)\),然后这个结论可以无痛转化一般的多项式中.从而 \(m_A(x)\) 次数不超过 \(n\),且根都是特征值.
另一方面,\(Ax=\lambda x\),所以 \(c_A(\lambda)x=c_A(A)x=0\).而 \(x\neq0\),所以 \(c_A(\lambda)=0\),即特征值都是 \(m_A(x)\) 的根.
所以 \(m_A(x)\mid m_B(x)\).同理 \(m_B(x)\mid m_A(x)\),所以 \(m_A(x)=m_B(x)\).
于是若 \(c_A(x)=\sum\limits_{i=0}^nc_ix^i\),则 \(A^{-1}=-c_0^{-1}\sum\limits_{i=0}^{n-1}c_{i+1}A^i\).
根子空间
设 \(m\) 个特征值 \(\lambda_0,\lambda_1,\cdots,\lambda_{m-1}\) 在极小多项式内的重数为 \(s_0,s_1,\cdots,s_{m-1}\),则 \(\sum\limits_{i=0}^{m-1}\ker(\lambda_iI_n-A)^{s_i}=\bigoplus\limits_{i=0}^{m-1}\ker(\lambda_iI_n-A)^{s_i}\).称 \(\ker(\lambda_iI_n-A)^{s_i}\) 为关于 \(\lambda_i\) 的根子空间.
可上三角化时,各个根子空间构成 \(V\) 的一个分解,这叫准素分解.如果还能证出来根子空间就是对应特征子空间那么就能对角化,实对称矩阵就是一个例子.
循环子空间
对一个向量 \(\alpha\in V\),定义 \(m_{A,\alpha}(\lambda)\in\mathbb F[\lambda]\) 为满足 \(m(A)(\alpha)=0\) 的次数最小的首一多项式.
称 \(\mathbb F[A]\alpha=\{f(A)(\alpha)\mid f(\lambda)\in\mathbb F[\lambda]\}\) 为 \(\alpha\) 的循环子空间,则和上面同理 \(\dim\mathbb F[A]\alpha=\deg m_{A,\alpha}(\lambda)\).
因为 \(m_A(A)(\lambda)=0\),所以 \(m_{A,\alpha}(\lambda)\) 必然是 \(m_A(A)(\lambda)\) 的因式.
考虑把 \(m_{A,\alpha}(\lambda)\) 分解为两个首一多项式 \(p(\lambda),q(\lambda)\in\mathbb F[\lambda]\) 的积,代入 \(\beta=p(A)(\alpha)\),考虑 \(m_{A,\beta}(\beta)\).
那么 \(q(A)(\beta)=q(A)(p(A)(\alpha))=m_{A,\alpha}(A)(\alpha)=0\),所以 \(m_{A,\beta}(\lambda)\mid q(\lambda)\).
而且 \(0=m_{A,\beta}(A)(\beta)=m_{A,\beta}(A)(p(A)(\alpha))=(p\cdot m_{A,\beta})(A)(\alpha)\),所以 \(p(\lambda)q(\lambda)=m_{A,\alpha}(\lambda)\mid p(\lambda)m_{A,\beta}(\lambda)\),也就是 \(q(\lambda)\mid m_{A,\beta}(\lambda)\).
可得 \(m_{A,p(A)(\alpha)}(\lambda)=q(\lambda)\).
因式可以构造了,考虑构造积.
对任意 \(\alpha_1,\alpha_2\),若 \((m_{A,\alpha_1}(\lambda),m_{A,\alpha_2}(\lambda))=1\),那么考虑 \(h(\lambda)=m_{A,\alpha_1+\alpha_2}(\lambda)\).
有 \(h(A)\alpha_1+h(A)\alpha_2=0\).因为 \(h(A)\alpha_1\in\mathbb F[A]\alpha_1,h(A)\alpha_2\in\mathbb F[A]\alpha_2\),根据互质 \(\mathbb F[A]\alpha_1\cap\mathbb F[A]\alpha_2\),所以这是 \(0\) 的唯一分解,有 \(h(A)\alpha_1=h(A)\alpha_2=0\).继而 \(m_{A,\alpha_1}(\lambda)m_{A,\alpha_2}(\lambda)\mid h(\lambda)\).
并且 \(m_{A,\alpha_1}(A)m_{A,\alpha_2}(A)(\alpha_1+\alpha_2)=m_{A,\alpha_2}(A)m_{A,\alpha_1}(A)\alpha_1+m_{A,\alpha_1}(A)m_{A,\alpha_2}(A)\alpha_2=0\),所以 \(h(\lambda)\mid m_{A,\alpha_1}(\lambda)m_{A,\alpha_2}(\lambda)\).
从而 \(h(\lambda)=m_{A,\alpha_1}(\lambda)m_{A,\alpha_2}(\lambda)\).
进一步,\(\forall f(\lambda)\in\mathbb F[\lambda],f(A)(\alpha_1+\alpha_2)=f(A)\alpha_1+f(A)\alpha_2\),所以 \(\mathbb F[A](\alpha_1+\alpha_2)\subset\mathbb F[A]\alpha_1\oplus\mathbb F[A]\alpha_2\).然而它们维数一致,所以 \(\mathbb F[A](\alpha_1+\alpha_2)=\mathbb F[A]\alpha_1\oplus\mathbb F[A]\alpha_2\).
如果有一组基 \(\alpha_0,\alpha_1,\cdots,\alpha_{n-1}\),那么 \(m_{A,\alpha_0}(\lambda),m_{A,\alpha_1}(\lambda),\cdots,m_{A,\alpha_{n-1}}(\lambda)\) 的任意公倍式 \(f(\lambda)\) 必然满足 \(f(A)(\alpha)=0\),所以 \(m_A(\lambda)\) 就是它们的 \(\operatorname{lcm}\).
然而现在可以轻松构造 \(\operatorname{lcm}\),所以 \(\exists\gamma\in V,s.t.m_{A,\gamma}(\lambda)=m_A(\lambda)\).接着就可以把 \(m_A(\lambda)=\prod\limits_{i=0}^{l-1}p_i^{t_i}(\lambda)\) 的标准分解各个因式直接构造出来.
尝试找到若干个向量使得它们的循环子空间的直和为 \(V\).
直接做太难了,有时间再回来研究下课件.
你说得对但是直接用下面的的方法为何不可呢?
对于一个不变子空间来说,它的所有向量的循环子空间均是它的子集.
相抵
考虑多项式矩阵 \(\lambda I_n-A\) 和 \(\lambda I_n-B\) 之间的关系:
\(P\) 可以拆成若干个初等矩阵的积,所以 \(\lambda I_n-A\) 和 \(\lambda I_n-B\) 相抵.
但是反过来也成立,即可以证明 \(\lambda I_n-A\) 和 \(\lambda I_n-B\) 相抵时 \(A\sim B\).
相抵转化成存在可逆的多项式矩阵 \(P(\lambda),Q(\lambda)\in M_n(\mathbb F[x])\) 使得:
根据上面说的可以把多项式矩阵化为矩阵多项式:
记:
两边系数一对比有:
于是只用求出来一个 \(\hat P_R(B)\) 或 \(\hat Q_L(A)\) 的逆元即可.
如果用 \(P(\lambda)P^{-1}(\lambda)=\hat P(\lambda)\hat P^{-1}(\lambda)=I_n\),那么两边对 \((\lambda-B)\) 左取模就能得到 \(\hat P_R(B)\hat P^{-1}_R(B)=I_n\).
如果用 \(Q(\lambda)Q^{-1}(\lambda)=\hat Q(\lambda)\hat Q^{-1}(\lambda)=I_n\),那么两边对 \((\lambda-A)\) 右取模就能得到 \(\hat Q_L(A)\hat Q^{-1}_L(A)=I_n\).
做完了.取模,神奇吧.
写作 \(\hat P_R(B),\hat Q_L(A)\) 是有原因的,因为实际上是把 \(\lambda\) 扩域后令 \(\lambda=B\) 的值.但是系数和未定元均为矩阵时乘法不交换,所以左取值和右取值不一样,这恰好对应了右取模和左取模结果不一样.
相似标准型
对于一个首一多项式 \(f(\lambda)=\lambda^n+\sum\limits_{i=0}^{n-1}a_i\lambda^i\in\mathbb F[\lambda]\),考虑设 \(f(\lambda)\) 的 Frobenius 块:
可以算出 \(c_{F(f(x))}(x)=f(x)\).因为有一个 \(n-1\) 阶子式是对角矩阵所以前 \(n-1\) 阶行列式因子全是 \(1\).考虑 \(\forall i\in(1,n)\cap\mathbb N\),有 \(e_i=F(f(x))e_{i-1}\),继而 \(e_i=F^i(f(x))e_0\),所以 \(I_n,F(f(x)),F^2(f(x)),\cdots,F^{m-1}(f(x))\) 线性无关,这样它的 \(\deg m_{F(f(x))}(x)=n\),所以 \(m_{F(f(x))}(x)=c_{F(f(x))}(x)\).
方便起见,将 \(M(\mathbb F)\) 中的矩阵的行列式因子,初等因子和不变因子定义为它们的特征矩阵的对应因子.
两个矩阵的特征矩阵的不变因子相同和它们相似等价,而不变因子唯一,所以可以根据不变因子来构造相似标准型.
将不变因子的友阵按顺序排到对角线得到 \(F\),其特征矩阵和 \(A\) 的特征矩阵相抵,所以 \(F\) 是一个相似标准型,称为 Frobenius 标准型.
分块对角矩阵的极小多项式就是各块极小多项式的 \(\operatorname{lcm}\),所以 \(n\) 阶不变因子就是极小多项式.
特征值 \(\lambda\) 的几何重数即 \(n-r(\lambda I_n-A)\),挨个考虑分块对角矩阵 \(\lambda I_n-A\) 的每个块,会发现如果 \(\lambda\) 在对应不变因子中出现时解空间大小为 \(1\),否则为 \(0\).把各个块加起来就可知 \(\lambda\) 的几何重数是它在不变因子中出现的次数.
考虑一个向量 \(\alpha\in V\),它的循环子空间必然是 \(A\) 的不变子空间,在基 \(\alpha,A\alpha,A^2\alpha,\cdots,A^{\deg m_{A,\alpha}(\lambda)-1}\) 下,限制出来的线性映射的表示矩阵是一个 Frobenius 块,所以它的特征多项式和极小多项式相等,且均为 \(\deg m_{A,\alpha}(\lambda)\).
根据 Frobenius 标准型,可以从取出每个块对应的一个向量,它们的循环子空间构成 \(V\) 的一个分解.
考虑从初等因子进行构造.设一个 \(C_s\in M_s(\mathbb F)\) 是一个只有右上角一个元素为 \(1\) 其他为 \(0\) 的矩阵,那么设 \(f(\lambda)\) 的 \(m\) 阶广义 Jordan 块:
和上面的证法类似,它的行列式因子,不变因子和初等因子均为 \(1,1,\cdots,1,f(\lambda)^m\).
将初等因子的广义 Jordan 块按顺序排到对角线得到 \(J\).这里 \(J\) 的特征矩阵和 \(A\) 的相抵并如上面一样显然,需要个神奇的性质.
若 \(f_1(\lambda),f_2(\lambda),g_1(\lambda),g_2(\lambda)\in\mathbb F[\lambda]\),则若 \((f_i(\lambda),g_j(\lambda))=1(i,j=1,2)\):
这两个矩阵的二阶行列式因子肯定一样,一阶行列式因子均等于 \((f_1(\lambda),f_2(\lambda))(g_1(\lambda),g_2(\lambda))\),所以相抵.
而初等因子都是不可约多项式的正整数次幂,所以把 \(A\) 的 Smith 标准型的每个对角线的元素用上面的性质拆一下,就可以得到和 \(J\) 的特征矩阵相抵的矩阵.
所以 \(J\) 是一个相似标准型,称为广义 Jordan 标准型.
回头
考虑一个特征值 \(\lambda_0\),放到广义 Jordan 标准型下看,可以轻松看出它代数重数是所有 \(\lambda-\lambda_0\) 对应的广义 Jordan 块的阶之和.
\(\lambda-\lambda_0\) 对应的广义 Jordan 块长得很特殊,主对角线全是 \(\lambda\),下副对角线上全是 \(1\).所以可以看出它的基里有且只有一个是特征向量,所以其特征子空间有且仅有 \(\lambda\) 的且维数是 \(1\).
继而 \(\lambda_0\) 的几何重数就是 \(\lambda-\lambda_0\) 对应的广义 Jordan 块的个数.
考虑到 \(0\) 的几何重数等于 \(\dim\ker A\),所以解空间大小事 \(0\) 对应的广义 Jordan 块的个数.
可对角化首先要可上三角化,然后要每个广义 Jordan 块的阶均为 \(1\),所以初等因子都是一次的,故当且仅当极小多项式无重根时可对角化.
对于一个不可约多项式 \(p(\lambda)\) 的友阵来说,它的所有非零向量的 \(m_{A,\alpha}(\lambda)\) 是这个多项式的因式而非 \(1\),所以就是这个多项式,所以循环子空间是整个 \(V\).
再所有不变子空间都是空间内若干向量的循环子空间的和,所以不存在非平凡不变子空间.
再考虑 \(p(\lambda)^m\) 的广义 Jordan 块,可以从后往前归纳证明它的任意向量的循环子空间必为某个 \(\dim p(\lambda)\) 的整数倍个后面的基向量的张成.同理它的所有不变子空间都长这样.
一个经典的事情是 \(r(A)>r(A^2)>\cdots>r(A^s)=r(A^{s+1})=r(A^{s+2})=\cdots\),现在其实可以做 \(r(A-\lambda_0I_n)>r((A-\lambda_0I_n)^2)>\cdots>r((A-\lambda_0I_n)^s)=r((A-\lambda_0I_n)^{s+1})=r((A-\lambda_0I_n)^{s+2})=\cdots\).
秩只和 \(0\) 的 Jordan 块有关,所以 \(A-\lambda_0I_n\) 的秩只和 \(A\) 的广义 Jordan 标准型中 \(\lambda_0\) 的 \(Jordan\) 块有关,剩下的部分全部可逆.
而 \(r(J_k(0)^m)=\max(k-m,0)\),所以幂次加一会把还没变 \(0\) 的 Jordan 块秩减 \(1\),剩下的部分要么已经变 \(0\) 了要么可逆反正秩不变.所以减的就是 \(r((A-\lambda_0I_n)^{m+1})-r((A-\lambda_0I_n)^m)\) 就是 \(\lambda_0\) 的阶数大于 \(m\) 的 Jordan 块的个数.
从这里可以看出 \(A\) 相似于 \(\operatorname{diag}(B,C)\),其中 \(B\) 是幂零矩阵 \(C\) 是可逆矩阵.
还有老生常谈的 \(\ker A^s\oplus\Im A^s=V\),现在进化为 \(\ker(A-\lambda_0I_n)^s\oplus\Im(A-\lambda_0I_n)^s=V\).
上三角分块
令 \(A\in M_n(\mathbb F),B\in M_m(\mathbb F)\),考虑 \(c_A(B)\),若 \((m_A(\lambda),m_B(\lambda))=d(\lambda)\),则 \(\exists f(\lambda),g(\lambda)\in\mathbb F[\lambda],s.t.f(\lambda)m_A(\lambda)+g(\lambda)m_B(\lambda)=d(\lambda)\).
代入 \(B\) 就有 \(f(B)m_A(B)=d(B)\).如果 \(d(\lambda)=1\) 那么 \(m_A(B)^{-1}=f(B)\).
所以若 \((m_A(\lambda),m_B(\lambda))=1\) 那么 \(m_A(B)\) 可逆.前面的条件在二者均可上三角化时相当于没有共同特征值.
此时考虑对 \(X\in M_{n\times m}(\mathbb F)\) 解 \(AX=XB\),那么因为有 \(0=m_A(A)X=Xm_A(B)\),所以 \(X=0\).
而 \(AX-XB\) 为关于 \(X\) 的的线性函数,所以 \(\ker(AX-XB)=0\),\(AX-XB=C\) 有唯一解.
若均可上三角化,那么可以证明 \(AX=XB\) 在 \(d(\lambda)\neq1\) 即 \(A,B\) 有公共特征值时有非零解.我目前不会把这个条件去掉.
\(AX-XB=C\) 有解时 \(\begin{pmatrix} I&0\\ X&I\\ \end{pmatrix}\begin{pmatrix} A&C\\ 0&B\\ \end{pmatrix}\begin{pmatrix} I&-X\\ 0&I\\ \end{pmatrix}=\operatorname{diag}(A,B)\),所以 \(\begin{pmatrix} A&C\\ 0&B\\ \end{pmatrix}\sim\operatorname{diag}(A,B)\).
分解
有个神奇的分解.
可以把 \(A\) 分解为可对角化矩阵 \(B\) 和幂零矩阵 \(C\) 的和,并且使 \(B\) 和 \(C\) 交换,而且分解唯一.
这里需要把可对角化扩展到任意域.上面可知可对角化当且仅当极小多项式无重根,所以可以定义 \((m_B(\lambda),m'_B(\lambda))=1\).
两个多项式 \(f(\lambda),g(\lambda)\) 互素是在任意超域下无重根的,因为 \(p(\lambda)f(\lambda)+q(\lambda)g(\lambda)=1\) 与域无关.
事实上把广义 Jordan 标准型中友阵组成的对角线拿出来当 \(B\),剩下的当成 \(C\) 即可.
令 \(c_A(\lambda)=\prod\limits_{i=0}^{m-1}p_i(\lambda)^{t_i}\),然后证明都是 \(\mathbb F[A]\) 内的元素,所以可交换.
考虑任意解 \(B_1\) 与 \(C_1\),有:
所以 \(B\) 和 \(B_1\) 可同时对角化,继而 \(B-B_1\) 可对角化.
复制粘贴即得到 \(C\) 和 \(C_1\) 交换,所以 \((C_1-C)^{2n}\) 可以根据二项式定理展开,每一项 \(C\) 和 \(C_1\) 至少一个幂次不小于 \(n\),所以 \(C_1-C\) 幂零.
但是 \(B-B_1=C_1-C\),所以两边等于零.
完全同理,可以把 \(A\) 分解为可对角化矩阵 \(B\) 和幺幂矩阵 \(C\) 的乘积,并且使 \(B\) 和 \(C\) 交换,而且分解唯一.幺幂矩阵是指 \(C-I_n\) 幂零.
可上三角化
由于代数基本定理,\(\mathbb F\subset\mathbb C\) 时,在 \(\mathbb C\) 下任意矩阵一定可上三角化,这叫 Schur 引理.
可上三角化的矩阵的广义 Jordan 标准型长得也极其特殊,称此时的广义 Jordan 标准型为 Jordan 标准型.
计算
设 \(J\) 表示对角线全一其他全零的矩阵,那么 \(J^i\) 为第 \(i\) 条副对角线全一其他全零的矩阵,并且 \(J^n=0,J^0=I\),而且 \(I,J,J^2,\cdots,J^{n-1}\) 线性无关.
这是什么,这长得和模 \(x^n\) 的多项式域一模一样.
考虑任意 Jordan 块 \(K=J(\lambda-\lambda_0,m)=\lambda_0I_n+J\).再考虑 \(f(\lambda)=\sum\limits_{i=0}c_i\lambda^i\in\mathbb F[\lambda]\),有:
注意 \(f\) 不仅可以是多项式函数.比如如果是 \(e^\lambda\):
把复矩阵化为 Jordan 标准型即可求其指数函数.
注意 \(f(A+B)\) 和 \(f(B+A)\) 需要交换才能相等.
幂次
考虑 \(K^k\),它的特征多项式必然是 \((\lambda-\lambda_0)^k\).
若 \(\lambda_0\neq0\),那么 \(\dim\ker(K^k-\lambda_0^kI_n)=\dim\ker\sum\limits_{j=1}\dbinom kj\lambda_0^{k-j}C^j=1\),而 \(j=1\) 时系数非零所以 \(\lambda_0^k\) 的特征子空间维数为 \(1\),故 \(K^k\) 的 Jordan 标准型仅有 \(J(\lambda-\lambda_0^k,m)\) 一个 Jordan 块.注意这里 \(k\) 可以是任意整数.
若 \(\lambda_0=0\) 则仍然只有 \(0\) 的 Jordan 块但分布情况不同,不过算一下秩即可.
继而对任意可上三角化矩阵转到 Jordan 标准型后可以方便求幂次.
如果特征值的根存在那么还可以开根.
不变子空间
如果 \(A\) 有一个不变子空间 \(W\),算一下就知道 \(A\) 的特征多项式是在 \(W\) 的限制上和 \(W\) 的任意一个补空间 \(U\) 上的限制上的特征多项式的乘积.如果 \(U\) 也是不变子空间,再对于一个特征空间 \(V_\lambda\),可以证明 \((V_\lambda\cap W)\oplus(V_\lambda\cap U)=V_\lambda\).
可交换
如果两个矩阵 \(A,B\) 可交换 \(AB=BA\),那么对于 \(A\) 的特征值 \(\lambda\),取其特征向量 \(x\in V_\lambda\):
所以 \(Bx\in V_\lambda\),即 \(A\) 的特征子空间都是 \(B\) 的不变子空间.
如果 \(A\) 和 \(B\) 都可以上三角化,那么它们可以被同时上三角化,即存在一个 \(P\) 使 \(P^{-1}AP\) 和 \(P^{-1}BP\).具体做法就是取 \(A\) 的一个特征子空间 \(V_\lambda\),然后 \(B\) 在 \(V_\lambda\) 上的限制的特征多项式是 \(B\) 的特征多项式的因式,所以也有特征向量.而这个向量也是 \(A\) 的特征向量,于是可以归纳做下去.
如果都可以被对角化,那么也能被同时对角化.\(A\) 的所有特征子空间直和是 \(V\),说明 \(B\) 存在一组不变子空间直和是 \(V\),这样 \(B\) 的特征空间可以被瓜分到各个子空间,所以每个子空间上的限制都可对角化,把特征向量拼起来就行了.
扩展到多个矩阵两两交换的情况也成立.
考虑和 \(A\) 交换的矩阵构成的 \(C(A)\),那么 \(\mathbb F[A]\) 是 \(C(A)\) 的一个子空间.
如果 \(c_A(\lambda)=m_A(\lambda)\) 一样,那么行列式因子,不变因子和初等因子只有一个,继而 Frobenius 标准型就是特征多项式的友阵,\(\dim\mathbb F[A]=n\),所有非零向量的循环子空间都是整个 \(V\),一切长起来都很平凡.
此时考虑变换基使 \(A\) 为 Frobenius 标准型,考虑设 \(Be_0=(b_0,b_1,\cdots,b_{n-1})^T\),则 \(\forall j\in[0,n-1]\cap\mathbb N\):
所以 \(B=\sum\limits_{i=0}^{n-1}b_iA^i\in\mathbb F[A]\).
如果不变因子有多个非一,那么其 Frobenius 标准型就会分出多个友阵 \(F_0,F_1,\cdots,F_{m-1}\).
现在倘若 \(f(F_i)=0\),那么 \(\forall j\in[0,i]\cap\mathbb N\),因为 \(m_{F_j}(\lambda)\mid m_{F_i}(\lambda)\mid f(\lambda)\),所以 \(f(F_j)=0\).所以如果 \(f(A)\) 有一块是零那么左上角都是零.
所以把 \(B=\operatorname{diag}(I,0)\),那么这显然与 \(A\) 可交换,但也可调整成左上角非零但右下角为零的情况.故 \(B\notin\mathbb F[A]\).
所以如果 \(\mathbb F[A]=C(A)\),那么 \(A\) 只可能是上面这种平凡的情况.
不变补空间
如果一个不变子空间 \(U\) 总存在不变补空间 \(W\),那么它的广义 Jordan 块大小均为 \(1\),说明可对角化.
可对角化时,不变子空间 \(U\) 和不变补空间 \(W\) 总能瓜分特征子空间即几何重数和特征多项式即代数重数.然后在限制的函数上几何重数不大于代数重数,所以不能一边分得多一边分得少,必须有几何重数等于代数重数,所以限制上总能对角化.