对角化

特征值与特征向量

设 \(V\) 为 \(F\)-向量空间，对于 \(T\in \text{end}(V)\)，\(\lambda \in F\)：

\(V_\lambda=\ker(\lambda\cdot \text{id}_V-T)\) 称为其特征子空间，即所有 \(u\) 满足 \(\lambda u=Tu\) 构成的空间。
若 \(V_{\lambda}\neq \{0\}\)，则 \(\lambda\) 称为 \(T\) 的一个特征值。\(V_{\lambda}\) 中的向量都称为 \(T\) 的特征向量，以 \(\lambda\) 为特征值。

回顾这和之前定义的特征多项式的相似之处：\(\text{Char}_A=\det(xI-A)\)，那么若 \(\lambda\) 满足 \(V_{\lambda}\neq \{0\}\)，将其带入 \(\text{Char}_T\)，就有 \(\text{Char}_T(\lambda)=\det(\lambda \cdot \text{id}_V-T)\)，而 \(\lambda \cdot \text{id}_V-T\) 作为线性映射其 kernal 不为零，这表明它一定不是满秩的，因此一定有 \(\det(\lambda\cdot \text{id}_V-T)=0\)，也就是说 \(\lambda\) 是特征多项式的根。

另一方面，\(\det=0\) 和不可逆是等价的，那么上述推导都可以完全反过来，因此：

\(T\) 的所有特征值恰好是 \(\text{Char}_T\) 的所有根

在 \(\text{Char}_T\) 的根中可能会出现重根，在 \(T\) 可对角化的前提下，如果有一个 \(k\) 重根 \(\lambda\)，这等价于在说 \(\dim V_\lambda=k\)。

何以故？若 \(\dim V_{\lambda}=k\)，则有 \(k\) 个线性无关的向量 \(u_1,u_2,\cdots,u_k\) 满足 \(\lambda u_i=T u_i\)（\(i=1,2,\cdots,k\)）。

从这 \(k\) 个线性无关向量扩张出 \(V\) 的一组基 \(u_1,u_2,\cdots,u_k,v_1,v_2,\cdots,v_{n-k}\)，则 \(T\) 在这组基上的矩阵 \(A\) 一定满足 \(Au_i=\lambda u_i\)，故 \(A_{11}=A_{22}=\cdots=A_{kk}=\lambda\)，对于 \(1\le i,j\le k,i\neq j\) 的 \(A_{ij}\) 皆为 \(0\)。换基不改变特征多项式，而 \(A\) 显然满足 \((x-\lambda)^k\mid\text{char}_A\)，因此 \(\lambda\) 是 \(\text{char}_T\) 的至少 \(k\) 重根。

注意到现在我们还不能确定其重根次数会不会更高，而且上述推导没有用到 \(T\) 可对角化的结论。

如果 \(T\) 可对角化，假设 \(T\) 共轭于 \(\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\)，则 \(\text{char}_T(x)=\prod(x-\lambda_i)\)，那么上述结论实属显然。

由此可见，特征多项式分裂是可对角化的必要条件。

作为反例，取 \(F=\mathbb C,T=\begin{pmatrix}1&1\\0&1\end{pmatrix}\in M_{2\times 2}(F)\)，则 \(\text{char}_T=(x-1)^2\)。

但 \(T(a,b)=(a,a+b)\)，令 \(T(a,b)=(a,b)\) 得 \(b=0\)，\(\lambda=1\) 时 \(\dim V_{\lambda}=1\)。\(T\) 当然也不可对角化。

如果 \(\lambda_1\neq\lambda_2\)，那么对 \(u\neq 0\)，显然 \(\lambda_1u\neq \lambda_2u\)。这表明一定有 \(V_{\lambda_1}\cap V_{\lambda_2}=\{0\}\)。

事实上，任取 \(\lambda_1,\lambda_2,\cdots,\lambda_m\in F\) 两两相异，则对任意的 \(i\)，\(V_{\lambda_i}\cap \sum_{j\neq i}V_{\lambda_j}=\{0\}\)。

注意两两无交并不能直接推出这个事。

证明：考虑若存在 \(v_i\in V_{\lambda_i}\)（\(i=1,2,\cdots,m\)）满足 \(\sum v_i=0\)，且 \(v_i\) 不全为 \(0\)，则

\[\sum \lambda_iv_i=\sum Tv_i=T\left(\sum v_i\right)=0 \]

另一方面，对任意的 \(i=1,2,\cdots,m\)，都有 \(\lambda_i(\sum v_i)=0\)，将两式相减，我们得到

\[\sum_{j\neq i}(\lambda_i-\lambda_j)v_j=0 \]

由于 \(\lambda\) 两两相异，则 \(\lambda_i-\lambda_j\neq 0\)，则当 \(v_j\neq 0\) 时有 \((\lambda_i-\lambda_j)v_j\neq 0\)，反之亦然。

那么我们取 \(i\) 满足 \(v_i\neq 0\)，得到 \(v'_j=(\lambda_i-\lambda_j)v_j\) 也满足 \(\sum v'_j=0\)，但 \(v'_{1\cdots m}\) 中的非零元个数恰好是 \(v_{1\cdots m}\) 中的非零元个数 \(-1\)。

如此下去，我们一定可以得到恰有一个非零元的 \(v_1,v_2,\cdots,v_m\)，但 \(\sum v_i=0\)，这是不可能的。

由此可见，如果 \(T\) 有 \(n\) 个相异的特征值 \(\lambda_1,\cdots,\lambda_n\)，那么 \(T\) 一定可对角化。

这是因为此时 \(\sum \dim V_{\lambda_i}\ge n\)，而上面证明 \(V_{\lambda_i}\) 给出 \(\sum V_{\lambda_i}\) 的一组直和分解，因此我们就得到 \(V\) 的直和分解 \(V_{\lambda_1},\cdots,V_{\lambda_m}\)，唯一可能是每个 \(\dim V_{\lambda_i}\) 均为 \(1\)，这立刻给出 \(T\) 的共轭矩阵 \(\text{diag}(\lambda_1,\cdots,\lambda_n)\)。

进一步，以下三者等价：

\(T\) 可以对角化
\(\sum_{\lambda\in F} \dim V_{\lambda}=\dim V\)
\(\oplus_{\lambda\in F}V_{\lambda}=V\)，这里我们上面已经证出直和总是有效的。

若 \(T\) 可以对角化，设 \(T\) 共轭于 \(\text{diag}(\lambda_1,\cdots,\lambda_n)\)，那么 \(\dim V_{\lambda}=\sum_{i=1}^n[\lambda=\lambda_i]\)，(1) => (2) 是显然的

若 \(\sum \dim V_{\lambda}=\dim V\)，比较 \(\oplus_{\lambda\in F}V_{\lambda},V\) 的维数可以得到 (3)

如果 (3) 成立，那么我们可以取出 \(n\) 个不同的特征向量，\(T\) 在这组基上的矩阵就是对角矩阵。

因此三者等价。

总结来看，想要将矩阵对角化，有一个办法是：

首先求出矩阵的特征多项式的所有根，则我们得到矩阵的所有特征值。
接下来只需要判断其所有特征子空间是否张成整个向量空间。
进一步只需要考虑维数，即 \(\dim V_{\lambda}=\dim \ker(\lambda\cdot \text{id}_V-T)\)，那么我们就只需要做消元法求矩阵的秩就好了。得到 \(V_{\lambda}\) 的基之后，利用之前的共轭换基手段换过来就好了。

极小多项式

对于任意线性映射 \(T\in \text{end}(V)\)，考虑集合

\[I=\{f\in F[x]:f(T)=0\} \]

那么，\(I\) 中一定存在唯一的首一多项式 \(\text{Min}_T\)，使得 \(\deg\text{Min}_T\) 极小，且 \(I=\text{Min}_T\cdot F[x]\)。

这是因为，考虑任意的 \(f,g\in F[x]\)，若 \(f\in I,g\in I\)，显然任意的 \(a,b\in F[x]\) 均满足 \(af+bg\in I\)，那么如此就有 \(\gcd(f,g)\in I\)。也可以说，不难验证 \(I\) 是 \(F[x]\) 的理想，这是主理想环，必有 \(\text{Min}_T\) 满足 \(I=(\text{Min}_T)\)。

根据 Cayley-Hamilton 定理，有 \(\text{Char}_T\in I\)，因此总有 \(\text{Min}_T\mid \text{Char}_T\)。

特别地，有 \(\deg\text{Min}_T\le \deg\text{Char}_T=\dim V\)。

如果 \(v\in V_{\lambda}\) 是之前定义的特征子空间，那么 \(Tv=\lambda v\)，对任意 \(f\in F[x]\)，就有

\[f(T)v=\sum_{k}a_kT^kv=\sum a_k\lambda^kv=f(\lambda)v \]

这表明，若 \(\lambda\) 是 \(T\) 的特征值，则对任意 \(f\in I,v\in V_{\lambda},v\neq 0\)，有 \(0=f(T)v=f(\lambda)v\)。

由于 \(v\neq 0\)，则必有 \(f(\lambda)=0\)，即 \(\lambda\) 是 \(f\) 的根，也就是说 \(\lambda\) 是 \(\text{Min}_T\) 的根。

反之，若 \(\text{Min}_T\) 有一个根 \(\lambda\in F\)，则 \(\lambda\) 也是 \(\text{Char}_T\) 的根，那么 \(\lambda\) 就是 \(T\) 的一个特征值。

这样证明的话，需要用到 Cayley-Hamilton 定理。

事实上，可以不使用这个定理：

若 \(\lambda\) 非特征值，则 \(T-\lambda\cdot\text{id}_V\) 可逆。如果 \(\lambda\) 是 \(\text{Min}_T\) 的根，那么 \((x-\lambda)\mid \text{Min}_T\)，由 \(\text{Min}_T(T)=0\) 两边作用 \((T-\lambda\cdot \text{id}_V)^{-1}\) 得到 \(\frac{\text{Min}_T}{X-\lambda}(T)=0\)，与最小性矛盾。

域的扩张不会影响最小多项式。

若 \(F\) 是 \(E\) 的子域，对于线性映射 \(A\in \text{end}(F^n)\)，考虑其在 \(F\) 上的极小多项式 \(\text{Min}_{F,A}\)，那么在 \(E\) 上的极小多项式 \(\text{Min}_{E,A}\) 一定满足 \(\text{Min}_{F,A}=\text{Min}_{E,A}\)。

这是因为，将 \(A\) 视同 \(M_{n\times n}(F)\) 中的元素后，\(f(x)=\sum_ka_kx^k\) 满足 \(f(T)=0\) 相当于解一个线性方程组，其解集在域扩张后自然不会发生变换。

假设向量空间 \(V\) 有直和分解 \(V=V_1\oplus\cdots\oplus V_k\)，且每个 \(V_i\) 都是 \(T\) 的不变子空间，那么有

\[\text{Min}_T=\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}}) \]

证明：首先，显然 \(\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}})\mid \text{Min}_T\)。

设 \(f=\text{lcm}(\text{Min}_{T|_{V_1}},\text{Min}_{T|_{V_2}},\cdots,\text{Min}_{T|_{V_k}})\)，则 \(f(T)|_{V_i}=0\) 对任意 \(i\) 成立，则 \(f(T)=0\)，则 \(\text{Min}_T\mid f\)。

作为推论，对于可对角化线性映射 \(T\)，设其特征值为 \(\lambda_1,\cdots,\lambda_m\)（不计重数），则 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\)。

这是因为对角化给出 \(V\) 的直和分解 \(V=\oplus_{i=1}^mV_{\lambda_i}\)，且每个都是 \(T\) 的不变子空间。在该空间中 \(T\) 的极小多项式就是 \(x-\lambda_i\)，因此 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\)。

对于 \(F\)-向量空间 \(V\)，设 \(T\in\text{end}(V),h\in F[x]\)，定义 \(V\) 的子空间

\[V[h]:=\ker(h(T))=\{u\in V:h(T)u=0\} \]

注意到总有 \(T(V[h])\subseteq V[h]\)，因此 \(V[h]\) 是一个 \(T\)-不变子空间。

例如，取 \(h(x)=x-\lambda\)，则 \(V[h]\) 就是先前提到的特征子空间 \(V_{\lambda}\)。

对任意线性映射 \(T\)，若 \(f,g,h\in F[x]\) 满足 \(f=gh\)，且 \(g,h\) 互质，则 \(V[f]=V[g]\oplus V[h]\)。

首先我们证明 \(V[g]\cap V[h]=\{0\}\)，由互质可知存在 \(a,b\in F[x]\)，使得 \(ag+bh=1\)。

如果 \(v\) 满足 \(h(T)v=g(T)v=0\)，则 \(v=a(T)g(T)v+b(T)h(T)v=0\)，故 \(V[g]\cap V[h]=\{0\}\)。

另一方面，对任意 \(v\in V[f]\)，有 \(h(T)g(T)v=f(T)v=0\)，因此 \(h(T)v\in V[g],g(T)v\in V[h]\)。

这样就有 \(v=a(T)g(T)v+b(T)h(T)v\)，前者在 \(V[h]\) 中，后者在 \(V[g]\) 中，则 \(V[f]\subseteq V[g]+V[h]\)。

对任意 \(u\in V[g],v\in V[h]\)，有 \(f(T)(u+v)=g(T)h(T)u+g(T)h(T)v=0\)，则 \(u+v\in V[f]\)。

综上有 \(V[f]=V[g]+V[h]\)。

那么，若 \(\text{Min}_T=\prod_{i=1}^mp_i^{e_i}\)，其中 \(p_i\in F[x],e_i\in \mathbb N\)，反复应用上述结论，则有直和分解

\[V=V[\text{Min}_T]=V[p_1^{e_1}]\oplus \cdots\oplus V[p_m^{e_m}] \]

如果 \(\text{Min}_T\) 可以分解为 \(\prod_{i=1}^m(x-\lambda_i)\) 的形式，且 \(\lambda_i\) 互不相同，即唯一分解中 \(e_i=1\)，我们就自然地得到了向量空间的直和分解 \(V=\oplus_{i=1}^mV_{\lambda_i}\)，这表明 \(T\) 可对角化。综上所述，我们证明了如下结论：

\(T\) 可以对角化当且仅当其极小多项式 \(\text{Min}_T\) 分裂且无重根。

上三角化

我们已经证明，\(T\in\text{end}(V)\) 可以对角化的充要条件是其极小多项式分裂而且无重根。

如果退而求其次，只需要将其上三角化呢？事实上此时这等价于 \(\text{Min}_T\) 分裂（但不一定无重根）。

上三角化用线性映射的语言表述，相当于可以取出一组基 \(v_1,\cdots,v_n\)，使得 \(\text{span}(v_1,\cdots,v_k)\) 都是 \(T\)-不变子空间。那么如果一个矩阵可以上三角化，设其上三角阵对角线中的元素为 \(\lambda_1,\cdots,\lambda_n\)，用线性映射的语言表述即 \(Tv_k-\lambda_kv_k\in \text{span}(v_1,\cdots,v_{k-1})\)，我们证明：\(h=\prod_{i=1}^n(x-\lambda_i)\) 满足 \(h(T)=0\)。

首先，有 \(Tv_1=\lambda_1v_1\)，则 \((T-\lambda_1I)v_1=0\)，即 \((T-\lambda_1I)|_{\text{span}(v_1)}=0\)。

假设对 \(1\le k< n\) 有 \(\left.\left(\prod_{i=1}^k(T-\lambda_iI)\right)\right|_{\text{span}(v_1,\cdots,v_k)}=0\)，那么注意到

\[Tv_{k+1}-\lambda_{k+1} v_{k+1}\in \text{span}(v_1,\cdots,v_k)\Rightarrow \prod_{i=1}^{k+1}(T-\lambda_iI)v_{k+1}=0 \]

则 \(\left.\left(\prod_{i=1}^{k+1}(T-\lambda_iI)\right)\right|_{\text{span}(v_1,\cdots,v_{k+1})}=0\)，如此递推下去就得到 \(\prod_{i=1}^n(x-\lambda_i)=0\)。

或者，你也可以使用 Cayley-Hamilton 定理来得到这个结论。

这表明 \(\text{Min}_T\mid \prod_{i=1}^n(x-\lambda_i)\)，后者分裂，因此前者必然分裂。

反之，若 \(\text{Min}_T\) 分裂，设 \(\text{Min}_T=\prod_{i=1}^m(x-\lambda_i)\)，那么每个 \(\lambda_i\) 都是 \(T\) 的特征值。

于是 \(\ker(T-\lambda_1I)\neq \{0\}\)，考虑 \(\text{im}(T-\lambda_1I)\)，它自然是 \(T\)-不变子空间，且它的维数严格小于 \(V\)。

显然 \(T|_{\text{im}(T-\lambda_1 I)}\) 也满足极小多项式分裂，那么对其递归地施加这个过程，我们就得到 \(\text{im}(T-\lambda_1I)\) 的一组基 \(v_1,\cdots,v_p\)，满足对任意 \(1\le k\le p\)，均有 \(\text{span}(v_1,\cdots,v_k)\) 均为 \(T\) 的不变子空间。

取 \(\text{ker}(T-\lambda_1I)\) 的基 \(u_1,\cdots,u_q\)，则 \(Tu_i=\lambda u_i\)，这表明 \(u_1,\cdots,u_q,v_1,\cdots,v_k\) 是一组符合条件的基。

结合代数基本定理，我们得到一个推论：\(\text{end}(\mathbb C^n)\) 上的任意矩阵必然都可上三角化。

并且，可以发现线性映射可上三角化实际上还等价于 \(\text{Char}_T\) 分裂。上面的证明步骤已经蕴含了这一事实。

进一步，若 \(\text{Char}_T=\prod_{i=1}^n(x-\lambda_i)\)，则有 \(\text{Char}_{T^m}=\prod_{i=1}^m(x-\lambda_i^m)\)，这可以这样推出：

分裂 => 可上三角 => 上三角矩阵的 \(m\) 次幂，其对角线元素恰好是本身 \(m\) 次幂 => \(\text{Char}_{T^m}=\prod(x-\lambda_i^m)\)

我们知道对任意域 \(F\) 和 \(f\in F[x]\)，都可以通过扩域使得 \(f\) 在某个域 \(E[x]\) 上分裂，且 \(F\) 是 \(E\) 的子域。

由于扩域不改变特征多项式，因此我们得到 Cayley-Hamilton 定理的另一种证明：（注意上述关于极小多项式等定理的推论都可以避开 C-H 定理）首先通过扩域使得 \(\text{Char}_T\) 分裂为 \(\prod_{i=1}^n(x-\lambda_i)\)，其中 \(\lambda_i\in E\)，则 \(T\) 在 \(E\) 上可以上三角化。那么 \(\prod_{i=1}^n(T-\lambda_iI)=0\) 的证明已经在前面的证明步骤中给出了。

练习：设 \(T\in\text{end}(\mathbb C^n)\)，通过纯量限制可以将其视为 \(\text{end}(\mathbb R^{2n})\) 中的线性映射 \(T'\)，证明 \(\det T'=(\det T)^2\)

\(T\) 一定可上三角化，则 \(T'\) 是分块上三角的，且每一块中的对角线位置都是 \(T\) 中对应位置重复两遍，由此上述命题实属显然。严格的论述可以说，取 \(\mathbb C^n\) 的一组基使得 \(T\) 在这组基下上三角，等等。

广义特征子空间

对于 \(h\in F[x],T\in \text{end}(V)\)，沿用 \(V[h]:=\ker(h(T))\) 的记号，定义广义特征子空间

\[V_{[\lambda],N}=V[(x-\lambda)^N]\\ V_{[\lambda]}=\bigcup_{N\ge 1}V_{[\lambda],N} \]

尽管子空间的并，不一定是子空间（事实上无限域中有限个严格子空间的并总是不构成子空间），但容易证明这里的 \(V_{[\lambda]}\) 的确是子空间。这就定义为 \(T\) 相对于 \(\lambda\) 的广义特征子空间。

如此，假设 \(\text{Min}_T\) 分裂，我们就能将 \(V\) 分解为广义特征子空间的直和，且每个直和项都是 \(T\)-不变子空间。

若 \(V_{[\lambda]}\neq \{0\}\)，则 \(\lambda\) 也是 \(T\) 的特征值：任取 \(v\in V_{[\lambda]}\setminus \set{0}\)，取最小的 \(n\) 使得 \((T-\lambda I)^nv= 0\)，则 \((T-\lambda I)^{n-1}v\in V_{\lambda}\)，这表明 \(\lambda\) 是 \(T\) 的特征值。

对于任意线性映射 \(T\)，我们考虑一系列子空间 \(\ker T\subseteq \ker T^2\subseteq \cdots\subseteq \ker T^{n}\subseteq\cdots\)

我们证明：如果 \(\ker T^m=\ker T^{m+1}\)，则对任意 \(i\ge m,\ker T^i=\ker T^m\)。

这是因为，考虑任取 \(k\ge 1\)，则显然有 \(\ker T^{m+k}\subseteq \ker T^{m+k+1}\)。

另一方面若 \(u\in \ker T^{m+k+1}\)，则 \(T^ku\subseteq \ker T^{m+1}\)，根据 \(\ker T^{m+1}=\ker T^m\) 我们知道 \(T^ku\in \ker T^{m}\)，那么 \(u\in \ker T^{m+k}\)，这表明 \(\ker T^{m+k+1}\subseteq \ker T^m\)，这就完成了证明。

那么进一步，这一系列 \(\ker T^k\) 一定是某一个前缀在严格增长，从某一个 \(m\) 开始，以后的 \(\ker T^k\) 都不变了。由于每次严格增长至少导致维数增加 \(1\)，因此至多到 \(\ker T^{\dim V}\) 时就不会变了。

回到广义特征子空间，根据以上结论，一定有 \(V_{[\lambda]}=V_{[\lambda],\dim V}\)。

我们进一步说明，实际上还能拓展为 \(V_{[\lambda]}=V_{[\lambda],b}\)，其中 \(b\) 是满足 \((x-\lambda)^b\mid \text{Min}_T\) 的最大 \(b\)。

显然前者包含后者，那么我们只需要证明后者也包含前者即可。

如果 \(u\in V_{[\lambda]}\)，那么对某个 \(k\le \dim V\) 有 \((T-\lambda I)^ku=0\)。如果 \(k\le b\) 则显然 \(u\in V_{[\lambda],b}\)。

若 \(k>b\)，设 \(g=\gcd(\text{Min}_T,(x-\lambda)^k)=(x-\lambda)^p\)，其中 \(p\le b\)。

则存在 \(a,b\in F[x]\) 使得 \(g=a\cdot \text{Min}_T+b\cdot (x-\lambda)^k\)，有 \(g(T)u=0\)，则 \(u\in V_{[\lambda],p}\subseteq V_{[\lambda],b}\)。

这就完成了证明。

由此可得，我们之前根据 \(\text{Min}_T=\prod(x-\lambda_i)^{b_i}\) 给出过 \(V\) 的直和分解：\(V=\oplus V[(x-\lambda_i)^{b_i}]\)，这实际上就是

\[V=\oplus V_{[\lambda_i]} \]

也就是说针对线性映射 \(T\)，\(V\) 是它的所有广义特征子空间的直和（尽管对特征子空间不一定成立）。

我们先前讨论过，若 \(\dim V_{\lambda}=a\)，那么一定有 \((x-\lambda)^a\mid \text{Char}_T\)，但反过来却不一定。

实际上，\((x-\lambda)\) 在 \(\text{Char}_T\) 中的次数恰好是 \(\dim V_{[\lambda]}\)。

这是因为根据直和分解 \(V=\oplus V_{[\lambda_i]}\)，我们考虑线性映射 \(T_i:=T|_{V_{[\lambda_i]}}\)，则 \(\text{Min}_{T_i}\mid (x-\lambda_i)^{b_i}\)。

设 \(\text{Char}_T=\prod(x-\lambda_i)^{a_i}\)，由于 \(\text{Min}_{T_i},\text{Char}_{T_i}\) 的根集相同，则 \(\text{Char}_{T_i}=(x-\lambda_i)^k\) 对某个正整数 \(k\) 成立，再由 \(\text{Char}_T=\prod \text{Char}_{T_i}\) 以及 \(\lambda_i\) 互不相同，就得到 \(\text{Char}_{T_i}=(x-\lambda_i)^{a_i}\)，因此必有 \(a_i=\dim V_{[\lambda]}\)。

定义：当 \(\text{Char}_T\) 分裂时，对于 \(\lambda \in F\)，\(\dim V_{[\lambda]}\) 就称为 \(\lambda\) 的代数重数，而 \(\dim V_{\lambda}\) 则记为几何重数。

先前已经说明，矩阵可对角化时集合重数一定等于代数重数。

而如果两者相等，则有 \(\sum \dim V_{\lambda}=\sum \dim V_{[\lambda]}=\dim V\)，则矩阵可以对角化。

Jordan-Chevalley 分解

额

同步对角化

设 \(\mathcal S=\set{T_1,T_2,\cdots,T_k}\subseteq \text{end}(V)\)，我们希望找到一组基 \(v_1,\cdots,v_n\) 使得 \(T_1,\cdots,T_k\) 在这一组基下都是对角矩阵。事实上，可以证明，这等价于以下两个条件均成立：

每个 \(T_i\) 均可对角化。
对任意 \(i,j\)，有 \(T_iT_j=T_jT_i\)。

充分性：此时对任意 \(T_i\)，考虑 \(V_{i,\lambda}:=\ker(T_i-\lambda\cdot \text{id}_V)=\set{u:T_iu=\lambda u}\)。

我们发现对任意的 \(j\)，若 \(T_iu=\lambda u\)，有 \(T_iT_ju=T_jT_iu=T_j\lambda u=\lambda T_ju\)，即 \(T_ju\in V_{i,\lambda}\)。

那么 \(V_{i,\lambda}\) 相对于任意的 \(T_j\) 都是不变子空间，由于任意 \(T_i\) 可对角化，直接按照 \(T_1\) 给出 \(V\) 的直和分解

\[V=\oplus_{\lambda \in F} \ker(T_1-\lambda\cdot \text{id}_V)=\oplus_{\lambda\in F}V_{\lambda} \]

我们对每个 \(V_{\lambda}\) 将 \(T_2,\cdots,T_k\) 限制在 \(V_{\lambda}\) 上接着做下去，类似归纳地我们可以取出一组基 \(v_1,\cdots,v_m\in V_{\lambda}\) 使得 \(T_2,\cdots,T_k\) 在这组基下均为对角矩阵，而 \(T_1\) 在 \(V_{\lambda}\) 的任意基下都满足 \(T_1v=\lambda v\) 即 \(T_1\) 对角，所以就符合条件了。

对于必要性，假设存在这么一组基 \(v_1,\cdots,v_n\)，且 \(T_iv_j=\lambda_{i,j}v_j\)，那么对任意 \(v=\sum a_iv_i\in V\)，有

\[T_iT_jv=T_i\sum T_ja_kv_k=T_i\sum_ka_k\lambda_{j,k}v_k=\sum_ka_k\lambda_{i,k}\lambda _{j,k}v_k \]

这关于 \(i,j\) 是对称的，所以自然满足可交换性。

posted @ 2024-12-07 20:16 云浅知处阅读(320) 评论(3) 收藏举报

刷新页面返回顶部

云浅的小窝

对角化