对角化

特征值与特征向量

\(V\)\(F\)-向量空间,对于 \(T\in \text{end}(V)\)\(\lambda \in F\)

  • \(V_\lambda=\ker(\lambda\cdot \text{id}_V-T)\) 称为其特征子空间,即所有 \(u\) 满足 \(\lambda u=Tu\) 构成的空间。
  • \(V_{\lambda}\neq \{0\}\),则 \(\lambda\) 称为 \(T\) 的一个特征值。\(V_{\lambda}\) 中的向量都称为 \(T\) 的特征向量,以 \(\lambda\) 为特征值。

回顾这和之前定义的特征多项式的相似之处:\(\text{Char}_A=\det(xI-A)\),那么若 \(\lambda\) 满足 \(V_{\lambda}\neq \{0\}\),将其带入 \(\text{Char}_T\),就有 \(\text{Char}_T(\lambda)=\det(\lambda \cdot \text{id}_V-T)\),而 \(\lambda \cdot \text{id}_V-T\) 作为线性映射其 kernal 不为零,这表明它一定不是满秩的,因此一定有 \(\det(\lambda\cdot \text{id}_V-T)=0\),也就是说 \(\lambda\) 是特征多项式的根。

另一方面,\(\det=0\) 和不可逆是等价的,那么上述推导都可以完全反过来,因此:

  • \(T\) 的所有特征值恰好是 \(\text{Char}_T\) 的所有根

\(\text{Char}_T\) 的根中可能会出现重根,\(T\) 可对角化的前提下,如果有一个 \(k\) 重根 \(\lambda\),这等价于在说 \(\dim V_\lambda=k\)

何以故?若 \(\dim V_{\lambda}=k\),则有 \(k\) 个线性无关的向量 \(u_1,u_2,\cdots,u_k\) 满足 \(\lambda u_i=T u_i\)\(i=1,2,\cdots,k\))。

从这 \(k\) 个线性无关向量扩张出 \(V\) 的一组基 \(u_1,u_2,\cdots,u_k,v_1,v_2,\cdots,v_{n-k}\),则 \(T\) 在这组基上的矩阵 \(A\) 一定满足 \(Au_i=\lambda u_i\),故 \(A_{11}=A_{22}=\cdots=A_{kk}=\lambda\),对于 \(1\le i,j\le k,i\neq j\)\(A_{ij}\) 皆为 \(0\)。换基不改变特征多项式,而 \(A\) 显然满足 \((x-\lambda)^k\mid\text{char}_A\),因此 \(\lambda\)\(\text{char}_T\) 的至少 \(k\) 重根。

注意到现在我们还不能确定其重根次数会不会更高,而且上述推导没有用到 \(T\) 可对角化的结论。

如果 \(T\) 可对角化,假设 \(T\) 共轭于 \(\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\),则 \(\text{char}_T(x)=\prod(x-\lambda_i)\),那么上述结论实属显然。

由此可见,特征多项式分裂是可对角化的必要条件。

作为反例,取 \(F=\mathbb C,T=\begin{pmatrix}1&1\\0&1\end{pmatrix}\in M_{2\times 2}(F)\),则 \(\text{char}_T=(x-1)^2\)

\(T(a,b)=(a,a+b)\),令 \(T(a,b)=(a,b)\)\(b=0\)\(\lambda=1\)\(\dim V_{\lambda}=1\)\(T\) 当然也不可对角化。


如果 \(\lambda_1\neq\lambda_2\),那么对 \(u\neq 0\),显然 \(\lambda_1u\neq \lambda_2u\)。这表明一定有 \(V_{\lambda_1}\cap V_{\lambda_2}=\{0\}\)

事实上,任取 \(\lambda_1,\lambda_2,\cdots,\lambda_m\in F\) 两两相异,则对任意的 \(i\)\(V_{\lambda_i}\cap \sum_{j\neq i}V_{\lambda_j}=\{0\}\)

  • 注意两两无交并不能直接推出这个事。

证明:考虑若存在 \(v_i\in V_{\lambda_i}\)\(i=1,2,\cdots,m\))满足 \(\sum v_i=0\),且 \(v_i\) 不全为 \(0\),则

\[\sum \lambda_iv_i=\sum Tv_i=T\left(\sum v_i\right)=0 \]

另一方面,对任意的 \(i=1,2,\cdots,m\),都有 \(\lambda_i(\sum v_i)=0\),将两式相减,我们得到

\[\sum_{j\neq i}(\lambda_i-\lambda_j)v_j=0 \]

由于 \(\lambda\) 两两相异,则 \(\lambda_i-\lambda_j\neq 0\),则当 \(v_j\neq 0\) 时有 \((\lambda_i-\lambda_j)v_j\neq 0\),反之亦然。

那么我们取 \(i\) 满足 \(v_i\neq 0\),得到 \(v'_j=(\lambda_i-\lambda_j)v_j\) 也满足 \(\sum v'_j=0\),但 \(v'_{1\cdots m}\) 中的非零元个数恰好是 \(v_{1\cdots m}\) 中的非零元个数 \(-1\)

如此下去,我们一定可以得到恰有一个非零元的 \(v_1,v_2,\cdots,v_m\),但 \(\sum v_i=0\),这是不可能的。


由此可见,如果 \(T\)\(n\) 个相异的特征值 \(\lambda_1,\cdots,\lambda_n\),那么 \(T\) 一定可对角化。

这是因为此时 \(\sum \dim V_{\lambda_i}\ge n\),而上面证明 \(V_{\lambda_i}\) 给出 \(\sum V_{\lambda_i}\) 的一组直和分解,因此我们就得到 \(V\) 的直和分解 \(V_{\lambda_1},\cdots,V_{\lambda_m}\),唯一可能是每个 \(\dim V_{\lambda_i}\) 均为 \(1\),这立刻给出 \(T\) 的共轭矩阵 \(\text{diag}(\lambda_1,\cdots,\lambda_n)\)

进一步,以下三者等价:

  • \(T\) 可以对角化
  • \(\sum_{\lambda\in F} \dim V_{\lambda}=\dim V\)
  • \(\oplus_{\lambda\in F}V_{\lambda}=V\),这里我们上面已经证出直和总是有效的。

\(T\) 可以对角化,设 \(T\) 共轭于 \(\text{diag}(\lambda_1,\cdots,\lambda_n)\),那么 \(\dim V_{\lambda}=\sum_{i=1}^n[\lambda=\lambda_i]\),(1) => (2) 是显然的

\(\sum \dim V_{\lambda}=\dim V\),比较 \(\oplus_{\lambda\in F}V_{\lambda},V\) 的维数可以得到 (3)

如果 (3) 成立,那么我们可以取出 \(n\) 个不同的特征向量,\(T\) 在这组基上的矩阵就是对角矩阵。

因此三者等价。


总结来看,想要将矩阵对角化,有一个办法是:

  • 首先求出矩阵的特征多项式的所有根,则我们得到矩阵的所有特征值。
  • 接下来只需要判断其所有特征子空间是否张成整个向量空间。
  • 进一步只需要考虑维数,即 \(\dim V_{\lambda}=\dim \ker(\lambda\cdot \text{id}_V-T)\),那么我们就只需要做消元法求矩阵的秩就好了。得到 \(V_{\lambda}\) 的基之后,利用之前的共轭换基手段换过来就好了。

极小多项式

对于任意线性映射 \(T\in \text{end}(V)\),考虑集合

\[I=\{f\in F[x]:f(T)=0\} \]

那么,\(I\) 中一定存在唯一的首一多项式 \(\text{Min}_T\),使得 \(\deg\text{Min}_T\) 极小,且 \(I=\text{Min}_T\cdot F[x]\)

这是因为,考虑任意的 \(f,g\in F[x]\),若 \(f\in I,g\in I\),显然任意的 \(a,b\in F[x]\) 均满足 \(af+bg\in I\),那么如此就有 \(\gcd(f,g)\in I\)。也可以说,不难验证 \(I\)\(F[x]\) 的理想,这是主理想环,必有 \(\text{Min}_T\) 满足 \(I=(\text{Min}_T)\)


根据 Cayley-Hamilton 定理,有 \(\text{Char}_T\in I\),因此总有 \(\text{Min}_T\mid \text{Char}_T\)

特别地,有 \(\deg\text{Min}_T\le \deg\text{Char}_T=\dim V\)

如果 \(v\in V_{\lambda}\) 是之前定义的特征子空间,那么 \(Tv=\lambda v\),对任意 \(f\in F[x]\),就有

\[f(T)v=\sum_{k}a_kT^kv=\sum a_k\lambda^kv=f(\lambda)v \]

这表明,若 \(\lambda\)\(T\) 的特征值,则对任意 \(f\in I,v\in V_{\lambda},v\neq 0\),有 \(0=f(T)v=f(\lambda)v\)

由于 \(v\neq 0\),则必有 \(f(\lambda)=0\),即 \(\lambda\)\(f\) 的根,也就是说 \(\lambda\)\(\text{Min}_T\) 的根。

反之,若 \(\text{Min}_T\) 有一个根 \(\lambda\in F\),则 \(\lambda\) 也是 \(\text{Char}_T\) 的根,那么 \(\lambda\) 就是 \(T\) 的一个特征值。

这样证明的话,需要用到 Cayley-Hamilton 定理。

事实上,可以不使用这个定理:

  • \(\lambda\) 非特征值,则 \(T-\lambda\cdot\text{id}_V\) 可逆。如果 \(\lambda\)\(\text{Min}_T\) 的根,那么 \((x-\lambda)\mid \text{Min}_T\),由 \(\text{Min}_T(T)=0\) 两边作用 \((T-\lambda\cdot \text{id}_V)^{-1}\) 得到 \(\frac{\text{Min}_T}{X-\lambda}(T)=0\),与最小性矛盾。

域的扩张不会影响最小多项式。

\(F\)\(E\) 的子域,对于线性映射 \(A\in \text{end}(F^n)\),考虑其在 \(F\) 上的极小多项式 \(\text{Min}_{F,A}\),那么在 \(E\) 上的极小多项式 \(\text{Min}_{E,A}\) 一定满足 \(\text{Min}_{F,A}=\text{Min}_{E,A}\)

这是因为,将 \(A\) 视同 \(M_{n\times n}(F)\) 中的元素后,\(f(x)=\sum_ka_kx^k\) 满足 \(f(T)=0\) 相当于解一个线性方程组,其解集在域扩张后自然不会发生变换。


假设向量空间 \(V\) 有直和分解 \(V=V_1\oplus\cdots\oplus V_k\),且每个 \(V_i\) 都是 \(T\) 的不变子空间,那么有

\[\text{Min}_T=\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}}) \]

证明:首先,显然 \(\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}})\mid \text{Min}_T\)

\(f=\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}})\),则 \(f(T)|_{V_i}=0\) 对任意 \(i\) 成立,则 \(f(T)=0\),则 \(\text{Min}_T\mid f\)

作为推论,对于可对角化线性映射 \(T\),设其特征值为 \(\lambda_1,\cdots,\lambda_m\)(不计重数),则 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\)

这是因为对角化给出 \(V\) 的直和分解 \(V=\oplus_{i=1}^mV_{\lambda_i}\),且每个都是 \(T\) 的不变子空间。在该空间中 \(T\) 的极小多项式就是 \(x-\lambda_i\),因此 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\)


对于 \(F\)-向量空间 \(V\),设 \(T\in\text{end}(V),h\in F[x]\),定义 \(V\) 的子空间

\[V[h]:=\ker(h(T))=\{u\in V:h(T)u=0\} \]

注意到总有 \(T(V[h])\subseteq V[h]\),因此 \(V[h]\) 是一个 \(T\)-不变子空间。

例如,取 \(h(x)=x-\lambda\),则 \(V[h]\) 就是先前提到的特征子空间 \(V_{\lambda}\)


  • 对任意线性映射 \(T\),若 \(f,g,h\in F[x]\) 满足 \(f=gh\),且 \(g,h\) 互质,则 \(V[f]=V[g]\oplus V[h]\)

首先我们证明 \(V[g]\cap V[h]=\{0\}\),由互质可知存在 \(a,b\in F[x]\),使得 \(ag+bh=1\)

如果 \(v\) 满足 \(h(T)v=g(T)v=0\),则 \(v=a(T)g(T)v+b(T)h(T)v=0\),故 \(V[g]\cap V[h]=\{0\}\)

另一方面,对任意 \(v\in V[f]\),有 \(h(T)g(T)v=f(T)v=0\),因此 \(h(T)v\in V[g],g(T)v\in V[h]\)

这样就有 \(v=a(T)g(T)v+b(T)h(T)v\),前者在 \(V[h]\) 中,后者在 \(V[g]\) 中,则 \(V[f]\subseteq V[g]+V[h]\)

对任意 \(u\in V[g],v\in V[h]\),有 \(f(T)(u+v)=g(T)h(T)u+g(T)h(T)v=0\),则 \(u+v\in V[f]\)

综上有 \(V[f]=V[g]+V[h]\)


那么,若 \(\text{Min}_T=\prod_{i=1}^mp_i^{e_i}\),其中 \(p_i\in F[x],e_i\in \mathbb N\),反复应用上述结论,则有直和分解

\[V=V[\text{Min}_T]=V[p_1^{e_1}]\oplus \cdots\oplus V[p_m^{e_m}] \]

如果 \(\text{Min}_T\) 可以分解为 \(\prod_{i=1}^m(x-\lambda_i)\) 的形式,且 \(\lambda_i\) 互不相同,即唯一分解中 \(e_i=1\),我们就自然地得到了向量空间的直和分解 \(V=\oplus_{i=1}^mV_{\lambda_i}\),这表明 \(T\) 可对角化。综上所述,我们证明了如下结论:

  • \(T\) 可以对角化当且仅当其极小多项式 \(\text{Min}_T\) 分裂且无重根。

上三角化

我们已经证明,\(T\in\text{end}(V)\) 可以对角化的充要条件是其极小多项式分裂而且无重根。

如果退而求其次,只需要将其上三角化呢?事实上此时这等价于 \(\text{Min}_T\) 分裂(但不一定无重根)。

上三角化用线性映射的语言表述,相当于可以取出一组基 \(v_1,\cdots,v_n\),使得 \(\text{span}(v_1,\cdots,v_k)\) 都是 \(T\)-不变子空间。那么如果一个矩阵可以上三角化,设其上三角阵对角线中的元素为 \(\lambda_1,\cdots,\lambda_n\),用线性映射的语言表述即 \(Tv_k-\lambda_kv_k\in \text{span}(v_1,\cdots,v_{k-1})\),我们证明:\(h=\prod_{i=1}^n(x-\lambda_i)\) 满足 \(h(T)=0\)

首先,有 \(Tv_1=\lambda_1v_1\),则 \((T-\lambda_1I)v_1=0\),即 \((T-\lambda_1I)|_{\text{span}(v_1)}=0\)

假设对 \(1\le k< n\)\(\left.\left(\prod_{i=1}^k(T-\lambda_iI)\right)\right|_{\text{span}(v_1,\cdots,v_k)}=0\),那么注意到

\[Tv_{k+1}-\lambda_{k+1} v_{k+1}\in \text{span}(v_1,\cdots,v_k)\Rightarrow \prod_{i=1}^{k+1}(T-\lambda_iI)v_{k+1}=0 \]

\(\left.\left(\prod_{i=1}^{k+1}(T-\lambda_iI)\right)\right|_{\text{span}(v_1,\cdots,v_{k+1})}=0\),如此递推下去就得到 \(\prod_{i=1}^n(x-\lambda_i)=0\)

  • 或者,你也可以使用 Cayley-Hamilton 定理来得到这个结论。

这表明 \(\text{Min}_T\mid \prod_{i=1}^n(x-\lambda_i)\),后者分裂,因此前者必然分裂。

反之,若 \(\text{Min}_T\) 分裂,设 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\),那么每个 \(\lambda_i\) 都是 \(T\) 的特征值。

于是 \(\ker(T-\lambda_1I)\neq \{0\}\),考虑 \(\text{im}(T-\lambda_1I)\),它自然是 \(T\)-不变子空间,且它的维数严格小于 \(V\)

显然 \(T|_{\text{im}(T-\lambda_1 I)}\) 也满足极小多项式分裂,那么对其递归地施加这个过程,我们就得到 \(\text{im}(T-\lambda_1I)\) 的一组基 \(v_1,\cdots,v_p\),满足对任意 \(1\le k\le p\),均有 \(\text{span}(v_1,\cdots,v_k)\) 均为 \(T\) 的不变子空间。

\(\text{ker}(T-\lambda_1I)\) 的基 \(u_1,\cdots,u_q\),则 \(Tu_i=\lambda u_i\),这表明 \(u_1,\cdots,u_q,v_1,\cdots,v_k\) 是一组符合条件的基。


结合代数基本定理,我们得到一个推论:\(\text{end}(\mathbb C^n)\) 上的任意矩阵必然都可上三角化。

并且,可以发现线性映射可上三角化实际上还等价于 \(\text{Char}_T\) 分裂。上面的证明步骤已经蕴含了这一事实。

进一步,若 \(\text{Char}_T=\prod_{i=1}^n(x-\lambda_i)\),则有 \(\text{Char}_{T^m}=\prod_{i=1}^m(x-\lambda_i^m)\),这可以这样推出:

  • 分裂 => 可上三角 => 上三角矩阵的 \(m\) 次幂,其对角线元素恰好是本身 \(m\) 次幂 => \(\text{Char}_{T^m}=\prod(x-\lambda_i^m)\)

我们知道对任意域 \(F\)\(f\in F[x]\),都可以通过扩域使得 \(f\) 在某个域 \(E[x]\) 上分裂,且 \(F\)\(E\) 的子域。

由于扩域不改变特征多项式,因此我们得到 Cayley-Hamilton 定理的另一种证明:(注意上述关于极小多项式等定理的推论都可以避开 C-H 定理)首先通过扩域使得 \(\text{Char}_T\) 分裂为 \(\prod_{i=1}^n(x-\lambda_i)\),其中 \(\lambda_i\in E\),则 \(T\)\(E\) 上可以上三角化。那么 \(\prod_{i=1}^n(T-\lambda_iI)=0\) 的证明已经在前面的证明步骤中给出了。


练习:设 \(T\in\text{end}(\mathbb C^n)\),通过纯量限制可以将其视为 \(\text{end}(\mathbb R^{2n})\) 中的线性映射 \(T'\),证明 \(\det T'=(\det T)^2\)

\(T\) 一定可上三角化,则 \(T'\) 是分块上三角的,且每一块中的对角线位置都是 \(T\) 中对应位置重复两遍,由此上述命题实属显然。严格的论述可以说,取 \(\mathbb C^n\) 的一组基使得 \(T\) 在这组基下上三角,等等。

广义特征子空间

对于 \(h\in F[x],T\in \text{end}(V)\),沿用 \(V[h]:=\ker(h(T))\) 的记号,定义广义特征子空间

\[V_{[\lambda],N}=V[(x-\lambda)^N]\\ V_{[\lambda]}=\bigcup_{N\ge 1}V_{[\lambda],N} \]

尽管子空间的并,不一定是子空间(事实上无限域中有限个严格子空间的并总是不构成子空间),但容易证明这里的 \(V_{[\lambda]}\) 的确是子空间。这就定义为 \(T\) 相对于 \(\lambda\) 的广义特征子空间。

如此,假设 \(\text{Min}_T\) 分裂,我们就能将 \(V\) 分解为广义特征子空间的直和,且每个直和项都是 \(T\)-不变子空间。

\(V_{[\lambda]}\neq \{0\}\),则 \(\lambda\) 也是 \(T\) 的特征值:任取 \(v\in V_{[\lambda]}\setminus \set{0}\),取最小的 \(n\) 使得 \((T-\lambda I)^nv= 0\),则 \((T-\lambda I)^{n-1}v\in V_{\lambda}\),这表明 \(\lambda\)\(T\) 的特征值。


对于任意线性映射 \(T\),我们考虑一系列子空间 \(\ker T\subseteq \ker T^2\subseteq \cdots\subseteq \ker T^{n}\subseteq\cdots\)

我们证明:如果 \(\ker T^m=\ker T^{m+1}\),则对任意 \(i\ge m,\ker T^i=\ker T^m\)

这是因为,考虑任取 \(k\ge 1\),则显然有 \(\ker T^{m+k}\subseteq \ker T^{m+k+1}\)

另一方面若 \(u\in \ker T^{m+k+1}\),则 \(T^ku\subseteq \ker T^{m+1}\),根据 \(\ker T^{m+1}=\ker T^m\) 我们知道 \(T^ku\in \ker T^{m}\),那么 \(u\in \ker T^{m+k}\),这表明 \(\ker T^{m+k+1}\subseteq \ker T^m\),这就完成了证明。

那么进一步,这一系列 \(\ker T^k\) 一定是某一个前缀在严格增长,从某一个 \(m\) 开始,以后的 \(\ker T^k\) 都不变了。由于每次严格增长至少导致维数增加 \(1\),因此至多到 \(\ker T^{\dim V}\) 时就不会变了。

回到广义特征子空间,根据以上结论,一定有 \(V_{[\lambda]}=V_{[\lambda],\dim V}\)


我们进一步说明,实际上还能拓展为 \(V_{[\lambda]}=V_{[\lambda],b}\),其中 \(b\) 是满足 \((x-\lambda)^b\mid \text{Min}_T\) 的最大 \(b\)

显然前者包含后者,那么我们只需要证明后者也包含前者即可。

如果 \(u\in V_{[\lambda]}\),那么对某个 \(k\le \dim V\)\((T-\lambda I)^ku=0\)。如果 \(k\le b\) 则显然 \(u\in V_{[\lambda],b}\)

\(k>b\),设 \(g=\gcd(\text{Min}_T,(x-\lambda)^k)=(x-\lambda)^p\),其中 \(p\le b\)

则存在 \(a,b\in F[x]\) 使得 \(g=a\cdot \text{Min}_T+b\cdot (x-\lambda)^k\),有 \(g(T)u=0\),则 \(u\in V_{[\lambda],p}\subseteq V_{[\lambda],b}\)

这就完成了证明。

由此可得,我们之前根据 \(\text{Min}_T=\prod(x-\lambda_i)^{b_i}\) 给出过 \(V\) 的直和分解:\(V=\oplus V[(x-\lambda_i)^{b_i}]\),这实际上就是

\[V=\oplus V_{[\lambda_i]} \]

也就是说针对线性映射 \(T\)\(V\) 是它的所有广义特征子空间的直和(尽管对特征子空间不一定成立)。


我们先前讨论过,若 \(\dim V_{\lambda}=a\),那么一定有 \((x-\lambda)^a\mid \text{Char}_T\),但反过来却不一定。

实际上,\((x-\lambda)\)\(\text{Char}_T\) 中的次数恰好是 \(\dim V_{[\lambda]}\)

这是因为根据直和分解 \(V=\oplus V_{[\lambda_i]}\),我们考虑线性映射 \(T_i:=T|_{V_{[\lambda_i]}}\),则 \(\text{Min}_{T_i}\mid (x-\lambda_i)^{b_i}\)

\(\text{Char}_T=\prod(x-\lambda_i)^{a_i}\),由于 \(\text{Min}_{T_i},\text{Char}_{T_i}\) 的根集相同,则 \(\text{Char}_{T_i}=(x-\lambda_i)^k\) 对某个正整数 \(k\) 成立,再由 \(\text{Char}_T=\prod \text{Char}_{T_i}\) 以及 \(\lambda_i\) 互不相同,就得到 \(\text{Char}_{T_i}=(x-\lambda_i)^{a_i}\),因此必有 \(a_i=\dim V_{[\lambda]}\)


定义:当 \(\text{Char}_T\) 分裂时,对于 \(\lambda \in F\)\(\dim V_{[\lambda]}\) 就称为 \(\lambda\) 的代数重数,而 \(\dim V_{\lambda}\) 则记为几何重数。

先前已经说明,矩阵可对角化时集合重数一定等于代数重数。

而如果两者相等,则有 \(\sum \dim V_{\lambda}=\sum \dim V_{[\lambda]}=\dim V\),则矩阵可以对角化。

Jordan-Chevalley 分解

同步对角化

\(\mathcal S=\set{T_1,T_2,\cdots,T_k}\subseteq \text{end}(V)\),我们希望找到一组基 \(v_1,\cdots,v_n\) 使得 \(T_1,\cdots,T_k\) 在这一组基下都是对角矩阵。事实上,可以证明,这等价于以下两个条件均成立:

  • 每个 \(T_i\) 均可对角化。
  • 对任意 \(i,j\),有 \(T_iT_j=T_jT_i\)

充分性:此时对任意 \(T_i\),考虑 \(V_{i,\lambda}:=\ker(T_i-\lambda\cdot \text{id}_V)=\set{u:T_iu=\lambda u}\)

我们发现对任意的 \(j\),若 \(T_iu=\lambda u\),有 \(T_iT_ju=T_jT_iu=T_j\lambda u=\lambda T_ju\),即 \(T_ju\in V_{i,\lambda}\)

那么 \(V_{i,\lambda}\) 相对于任意的 \(T_j\) 都是不变子空间,由于任意 \(T_i\) 可对角化,直接按照 \(T_1\) 给出 \(V\) 的直和分解

\[V=\oplus_{\lambda \in F} \ker(T_1-\lambda\cdot \text{id}_V)=\oplus_{\lambda\in F}V_{\lambda} \]

我们对每个 \(V_{\lambda}\)\(T_2,\cdots,T_k\) 限制在 \(V_{\lambda}\) 上接着做下去,类似归纳地我们可以取出一组基 \(v_1,\cdots,v_m\in V_{\lambda}\) 使得 \(T_2,\cdots,T_k\) 在这组基下均为对角矩阵,而 \(T_1\)\(V_{\lambda}\) 的任意基下都满足 \(T_1v=\lambda v\)\(T_1\) 对角,所以就符合条件了。

对于必要性,假设存在这么一组基 \(v_1,\cdots,v_n\),且 \(T_iv_j=\lambda_{i,j}v_j\),那么对任意 \(v=\sum a_iv_i\in V\),有

\[T_iT_jv=T_i\sum T_ja_kv_k=T_i\sum_ka_k\lambda_{j,k}v_k=\sum_ka_k\lambda_{i,k}\lambda _{j,k}v_k \]

这关于 \(i,j\) 是对称的,所以自然满足可交换性。

posted @ 2024-12-07 20:16  云浅知处  阅读(287)  评论(3)    收藏  举报