【高等代数】06 - 线性函数

　　在线性代数中，我们花了3篇讲解（双）线性函数的相关结论。这里我想把核心内容再阐述一遍，在忽略一些细节的同时，希望对整体结构有更深刻的理解。需要注意的是，这里双线性函数只是起点，后面的内积、酉变换、正规变换，都在不断地打破和拓展之前的概念，最终还是为了讨论特殊线性变换的标准型。

1. 双线性函数

1.1 双线性函数与正交

　　在有了双线性函数的定义后，可知在任意选定的一组基下，双行线函数\(f\)可由其度量矩\(A\)完全确定。站在矩阵的角度，相关概念也变得更加直观。比如固定左向量\(\alpha\)而得到的线性函数\(\alpha_L\)，可以对应到\(A\)的行向量的线性组合（系数为\(\alpha\)坐标）。而全体\(\alpha_L\)组成的线性函数空间\(W_L\)，则同构于\(A\)的行向量生成的线性空间。那些使得\(\alpha_L=0\)的全体\(\alpha\)（双线性函数的左根\(\text{rad}_Lf\)），则同构于\(\alpha A=0\)的解空间。对应右边的向量\(\beta\)，也有定义\(W_R\)和右根\(\text{rad}_Rf\)。当\(A\)满秩时，左右根皆为空，这时称双线性函数是非退化的。

　　不同基下的度量矩阵\(A,B\)也不相同，并且与两组基的变换矩阵\(P\)有关系式\(B=PAP'\)，这样的矩阵\(A,B\)称为合同矩阵。反之，同一组基下度量矩阵合同的变换，可以认为是同构的。为了讨论同构意义下双线性函数空间的结构，我们熟悉的方法是“不变”子空间的分割，为此还要规定式（1）左的正交性。可以证明，满足正交性的双线性函数必然是对称或反对称的，即\(A=A'\)或\(A=-A'\)。而双线性函数空间\(T_2(V)\)是对称\(S_2(V)\)和反对称\(A_2(V)\)双线性函数空间的直和，故而有些讨论可以集中在后两个空间上。

\[f(\alpha,\beta)=0\;\Leftrightarrow\;f(\beta,\alpha)=0\;\Leftrightarrow\;\alpha\perp\beta\tag{1}\]

　　正交性自然地引出了向量或子空间正交补（子空间）\(\alpha^\perp,\,W^\perp\)的概念。然后根据线性方程组的理论，容易推导\(W,W^\perp\)维度之间的关系（行列向量维数与解空间的关系）。特别地有，双线性函数的左右根相同，可以记作\(V^\perp=\text{rad}\,f\)。还有如果\(f\)在子空间\(W\)下非退化，易证\(W\)和\(W^\perp\)无交集、且维度之和是\(n\)，从而它们是\(V\)的正交分割（式（2））。

\[\text{rad}\,f|_W=0\;\Rightarrow\;W\oplus W^\perp=V\tag{2}\]

　　式（2）可直接用于对称和反对称双线性函数（矩阵）的标准型讨论上。若是对称矩阵，先任选\(f(\alpha,\alpha)\neq 0\)，根据式（2）先将\(V\)分解成\(\alpha\oplus\alpha^\perp\)，然后依此继续分解\(\alpha^\perp\)，直至剩下一个\(\text{rad}\,f\)。在选定的基下（根空间任意选），函数的度量矩阵是一个对角矩阵（合同标准型）。再看反对称矩阵，先任选\(f(\alpha,\beta)=1\)，根据式（2）从\(W=\left<\alpha,\beta\right>\)开始正交分解，最终得到\(\begin{bmatrix}0&1\\-1&0\end{bmatrix}\)和\(0\)组成的分块对角矩阵。

　　合同矩阵的秩是不变的，对称矩阵和反对称矩阵的秩在标准型上有明显的表现。反对称矩阵的秩一定是偶数，且标准型在任何域上的形式都是最简的。对称矩阵在不同域上还可以进一步讨论，以下先假定它的秩为\(r\)。在复数域上，通过调整基的系数，可得到标准型\(\text{diag}\{I_r,0_{n-r}\}\)。在实数域上则可以得到标准型\(\text{diag}\{I_p,-I_q,0_{n-r}\}\)，其中\(p+q=r\)。依次记三个子空间为\(V^+,V^-,V^\perp\)，注意前两者并不唯一，而后者就是根空间。另外不难证明，任何“正”子空间都与\(V^-\oplus V^\perp\)无交集，这就可以证得：\(p,q\)在任何标准型中都是一样的（惯性定律），它们被称为正（负）惯性指数。

1.2 内积与酉空间

　　实数域（或其子域）有更多实际的场景，把函数限定在实数域上还可以度量线性空间。为了引出长度的概念，还要对函数增加一个限定，即有\(f(\alpha,\alpha)>0\)恒成立。这时\(f\)只能选择对称函数，且正惯性指数就是\(n\)（称为正定的），这样的函数也叫内积，记作\(\alpha\cdot\beta\)。引入内积后的实线性空间也叫欧几里得空间。接下来自然就是定义向量的长度\(\left\|\alpha\right\|\)、距离\(d(\alpha,\beta)\)、角度（式（3）），以及得到三角不等式和勾股定理（式（4,5），这里不再重复讲述。

\[\theta=\arccos{\frac{\alpha\cdot\beta}{\left\|\alpha\right\|\cdot\left\|\beta\right\|}}\tag{3}\]

\[\left|\:\left\|\alpha\right\|-\left\|\beta\right\|\:\right|\leqslant\left\|\alpha+\beta\right\|\leqslant\left\|\alpha\right\|+\left\|\beta\right\|\tag{4}\]

\[\left\|\alpha\right\|^2+\left\|\beta\right\|^2=\left\|\alpha+\beta\right\|^2\tag{5}\]

　　有时候也需要在复数域空间上定义度量的概念，但双线性函数显然不能满足要求，这时要将实内积的定义进行扩展。首先第一元仍然是线性的，然后交换变量满足式（6）左的Hermite性（可推导出第二元的半线性）。这样的二元函数在选定的基下也有式（6）右的合同矩阵（共轭对称矩阵），同样也能定义正交性以及解析其标准合同矩阵。最后如果加上正定性的要求，这样的二元函数就是复内积，或简称内积。引入内积后的复线性空间也叫酉空间，其上也可以定义长度（模）、距离、角度，以及有三角不等式和勾股定理。

\[f(\beta,\alpha)=\overline{f(\alpha,\beta)}\;\Rightarrow\;A'=\overline{A}\tag{6}\]

　　Hermite性可以兼容实空间的线性，且复内积也是兼容实空间的实内积的，进而酉空间其实是阿基米德空间的母空间。所以如果不特别强调，以下我们都在复数域上讨论。另外，在定义了正交的空间中（不限定为内积），如果二元函数是非退化的，则使用Schmidt正交化总可以找到一组正交基。在内积空间中，还可以找到单位向量组成的标准正交基，这时内积空间同构于向量对于基的系数组成的坐标空间，而内积就等于坐标向量的内积（式（7））。

\[\alpha\cdot\beta=x_1\overline{y_1}+x_2\overline{y_2}+\cdots+x_n\overline{y_n}\tag{7}\]

1.3 正规变换与对角化

　　在内积限制下的线性变换（映射）比较常见，这里有必要讨论一下它的标准型。首先限定变换下向量间的距离是不变的（保距变换），不难证明它是一个双射的线性变换，而且等价于：将一组标准正交基变换为另一组标准正交基。也就是说变换矩阵满足\(P\overline{P'}=I\)，这样的矩阵叫酉矩阵（实数域下叫正交矩阵），这样的变换则叫酉变换（实数域叫正交变换）。酉矩阵是名副其实的“单位矩阵”，它的行列式的模为1（利用特征式），所有特征值的模也为1（利用单位向量的变换），所有行（列）向量是正交的单位向量。

　　当我们讨论酉变换\(A\)（酉矩阵）的标准型时，其实并不一定有内积空间的定义，但如果补齐这部分定义，就能利用其独有的结构特点。正交性可以使空间分割变得非常方便，结合线性变换需要的\(A\)-子空间，容易想到去寻找一组正交的特征向量。先随意找到一个特征向量\(\eta\)，并生成\(A\)-子空间\(W\)，容易证得\(V=W\oplus W^\perp\)。接下来利用双射性可知\(W^\perp\)也是\(A\)-子空间（式（8），这一步不可缺少），从而可以在\(W^\perp\)中继续寻找特征向量，最终得到式（9）的标准型。由于寻找的特征向量是正交的，\(P\overline{P'}\)一定是一个对角矩阵，如果把特征向量单位化，\(P\)也可以是酉矩阵。

\[\alpha\cdot A\beta=A\alpha'\cdot A\beta=\alpha'\cdot\beta=0\tag{8}\]

\[PAP^{-1}=\text{diag}\,\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\tag{9}\]

　　任意变换矩阵\(A\)都定义在某组基下，如果将这组基定义为标准正交基，该定义便可扩展成整个域上的内积空间。刚才我们看到了正交在对角化中的作用，现在来继续榨取这个工具的威力，把对角化的范围尽量扩大。值得提醒的是，这里的讨论需借助内积的概念，因此线性空间被限定在数域上，对角化也只讨论正交对角化。现在回顾上面的讨论，最关键的一个条件是：如果\(W\)是\(A\)-子空间，则\(W^\perp\)也是\(A\)-子空间。为此就要有\(\alpha\cdot A\beta=\alpha'\cdot\beta\)，其中\(\alpha,\alpha'\in W;\;\beta\in W^\perp\)。如果不限定向量的范围，等式中的\(\alpha'\)总是有解的，记\(A^*:\alpha\rightarrow\alpha'\)，不难证明它是线性变换，且满足\(A^*=\overline{A'}\)，它也称为\(A\)的伴随变换。

　　伴随变换的矩阵关系\(A^*=\overline{A'}\)，使得它的定义可以更加自由灵活，比如教材上一般定义为\(A\alpha\cdot\beta=\alpha\cdot A^*\beta\)。这里还会发现一个简单事实，如果\(W\)是\(A\)-子空间，那么\(W^\perp\)就是\(A^*\)-子空间。想要从特征空间\(W=\left<\eta\right>\)开始构造对角化，就要证明\(W^\perp\)是\(A\)-子空间，这也等价于\(W\)是\(A^*\)-子空间。不过在此之前，我们先从\(A\)可正交对角化出发，看看变换还有什么必要条件。记正交对角化\(A=PDP^{-1}\)，则有\(A^*=P\bar{D}P^{-1}\)，这时\(AA^*=A^*A\)。反之，可交换性使得\(A,A^*\)能像标量一样在表达式里“自由穿梭”，比如容易有\(\left\|A\alpha\right\|=\left\|A^*\alpha\right\|\)，更一般的还有\(\left\|f(A)\alpha\right\|=\left\|f(A^*)\alpha\right\|\)。

　　特别地，则有我们需要的\(\left\|(A-\lambda I)\alpha\right\|=\left\|(A^*-\overline\lambda I)\alpha\right\|=0\)，即\(W\)是\(A^*\)-子空间。综合这两段的讨论便有，数域上的线性变换\(A\)可正交对角化的充要条件是：\(A\)有\(n\)个特征值且\(AA^*=A^*A\)（或式（10）的等价条件），满足式（10）的变换也称为正规变换。然后就可以构造一些常见的正规变换，比如上面讨论的酉变换，再比如复数域上的共轭对称变换\(A=\overline{A'}\)，也被称为Hermite变换，实数域上就是熟知的对称变换。酉变换和Hermite变换天然有\(n\)个特征值，而注意到Hermite变换的特征值都是实数，所以对称变换也有\(n\)个特征值（放到复数域看），它们都可以正交对角化。

\[AA^*=A^*A\;\Leftrightarrow\;\left\|A\alpha\right\|=\left\|A^*\alpha\right\|\tag{10}\]

2. 多重线性函数

（暂且搁置）

posted on 2021-05-22 11:26 卞爱华阅读(1865) 评论(0) 收藏举报

刷新页面返回顶部