【学习笔记】线性代数_线性变换

5.1 线性变换的定义、性质与运算

5.1.2 线性变换的定义

定义 5.2

线性空间 \(_FV\) 中有 \(T: V\to V\) 满足:

  1. \(T (\alpha+\beta)=T (\alpha)+T (\beta)\)
  2. \(T (k\alpha)=kT (\alpha)\)

\(T\)线性变换

一些常见的线性变换:

  • \(T_\theta\) ,二维平面上逆时针旋转 \(\theta\)
  • \(D\)\(P[x]_n\) 上的多项式求导
  • \(\Pi_x\)\(R^3\)\(x\) 平面上的投影
  • \(T_0\),零变换
  • \(T_g\),恒等变换

5.1.3 线性变换的性质

  • \(T (0)=0,T (-\alpha)=-T (\alpha)\)

\[\left(\sum_{i=1}^nk_i\alpha_i\right)=\sum_{i=1}^nk_iT(\alpha_i) \]

  • 线性相关的向量组经过线性变换后依然线性相关

5.1.4 线性变换的运算

\(L (V)\) 为全体线性变换所成的集合,有以下运算

  1. 加法

    \((T_1+T_2)(\alpha)=T_1 (\alpha)+T_2 (\alpha)\)

  2. 数量乘法

    \((kT)(\alpha)=k[T (\alpha)]\)

  3. 乘法

    \((T_1 T_2)(\alpha)=T_1[T_2 (\alpha)]\)

    可以发现 \(L (V)\) 构成 \(P\) 上的一个线性空间

  4. 逆变换

    \(T\in L (V)\),若存在 \(S\in L (V)\) 使得

    \(ST=TS=T_g\)

    \(S\)\(T\) 的逆变换,记为 \(T^{-1}\),说 \(T\) 是可逆的

  5. 方幂

    \(T^k=T\cdot T^{k-1}\)

    \(T^0=T_g\)


5.2 线性变换的矩阵

5.2.1 线性变换的矩阵表示

定义 5.3

\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是线性空间 \(V\) 的一个基,\(T\)\(V\) 的一个线性变换,基的像可以表示为

\[\begin{aligned} T(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n)&=[T(\varepsilon_1),T(\varepsilon_2),\cdots,T(\varepsilon_n)]\\ &=[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n] \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\\ \end{bmatrix} \\ &=[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n]A \end{aligned} \]

定理 5.1

对一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)\(\exists\) 唯一的线性变换 \(T\) 使得 \(T (\varepsilon_i)=\alpha_i (i\in[n])\)

由此定理可以得到,\(T\)\(A\) 一一对应,\(A\) 称为 \(T\) 在基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 下的矩阵,同时该矩阵其实就是两组基之间的过渡矩阵

定理 5.2

线性变换的运算和其对应矩阵的运算等价

定理 5.3

在相同基下,若 \(T\) 在该基下的矩阵为 \(A\)\(\xi\) 对应坐标为 \(X=[x_1, x_2,\cdots, x_n]^T\)\(T (\xi)\) 对应坐标为 \(Y=[y_1, y_2,\cdots, y_n]^T\),有

\[Y=AX \]

5.2.2 线性变换在不同基下的矩阵间的关系

定理 5.4

\(T\) 在两组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)\(\eta_1,\eta_2,\cdots,\eta_n\) 下的矩阵为 \(A, B\),且前者到后者的过渡矩阵为 \(M\),则

\[MB=AM,B=M^{-1}AM \]

定义 5.4

若存在 \(P\) 使得 \(B=P^{-1}AP\),称 \(A\) 相似于 \(B\),记作 \(A\sim B\)

可以发现其满足反身性,对称性,传递性

定理 5.5

两个 \(n\) 阶相似方阵可以看作同一个线性变换在不同基下的矩阵


5.3 特征值与特征向量

5.3.1 特征值与特征向量的概念

定义 5.5

\(T\)\(_FV\) 上的一个线性变换,若 \(\exists\lambda_0\in F,\alpha\in V,\alpha\neq 0\) 使得 \(T (\alpha)=\lambda_0\alpha\),称 \(\lambda_0\)\(T\) 的特征值,\(\alpha\)\(T\) 的属于特征值 \(\lambda_0\) 的特征向量

定义 5.6

\(V_{\lambda_0}=\{\alpha\in V|T (\alpha)=\lambda_0\alpha\}\) 是一个 \(V\) 的子空间,称为特征子空间

5.3.2 特征值与特征向量的求法

任取一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)\(T (\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n)=(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) A\)

有特征向量 \(\lambda\) 满足 \(AX=\lambda X\) 有非零解

因此 \((\lambda E-A) X=0\) 有非零解,于是 \(|\lambda E-A|=0\)

定义 5.7

\(|\lambda E-A|\) 称为 \(A\)特征多项式,是一个在数域 \(P\) 上的多项式,记为 \(f (\lambda)=|\lambda E-A|\), 其根称为 \(A\) 的特征根(特征值)

特征值代入 \(\lambda\) 可以得到 \(A\) 的属于 \(\lambda_0\) 的特征向量

补充概念:

特征值 \(\lambda_i\)代数重数几何重数

  • 代数重数:特征方程的某一个根的重根数,形式化地说,若 \(f (\lambda)=\prod\limits_{i=1}^k (\lambda-\lambda_i)^{r_i}\),则 \(\lambda_i\) 的代数重数就是 \(r_i\)

  • 几何重数:\((\lambda_i E-A) X=0\) 的基础解系的向量个数

有:几何重数 \(\le\) 代数重数

同时有如下结论:

  • 在复数域上,\(A\) 总有特征值,但是在其他数域上不一定

  • \(A\) 的特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)\(A^2\) 的特征值为 \(\lambda_1^2,\lambda_2^2,\cdots,\lambda_n^2\)\(\lambda_0 E+A\) 的特征值为 \(\lambda_0+\lambda_1,\lambda_0+\lambda_2,\cdots,\lambda_0+\lambda_n\)

    (可根据定义证明)

  • \(\lim\limits_{\lambda_0\to 0}|\lambda_0 E-A|=|A|\),利用该性质可以用可逆矩阵逼近不可逆矩阵,以使不可逆矩阵获得可逆矩阵的一些性质,以下是一个例子:

\(A=(a_{ij})_{n\times n}, B=(b_{ij})_{n\times n}\),证明 \((AB)^*=B^*A^*, A^*=\operatorname{adj}(A)\)(伴随矩阵)


证:当 \(A, B\) 为可逆矩阵,有 \((AB)^*=|AB|(AB)^{-1}=|A||B|B^{-1}A^{-1}=|B|B^{-1}|A|A^{-1}=B^*A^*\)

\(A, B\) 不都可逆时

\[\begin{aligned} \big((\lambda_0E+A)(\lambda_0E+B)\big)^*&=(\lambda_0 E+B)^*(\lambda_0 E+A)^*\\ \lim_{\lambda\to0}\big((\lambda E+A)(\lambda E+B)\big)^*&=\lim_{\lambda\to0}\big((\lambda E+B)^*(\lambda E+A)^*\big)\\ &=\lim_{\lambda\to0}(\lambda E+B)^*\lim_{\lambda\to 0}(\lambda E+A)^*\\ (AB)^*&=B^*A^* \end{aligned} \]

定理 5.6

相似矩阵具有相同的特征多项式,特征值、特征向量和取定的基无关

5.3.3 特征多项式的基本性质

\[f(\lambda)=|\lambda E-A|=\lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^n|A| \]

可知:

  • 在复数域上,若 \(f (\lambda)=\prod\limits_{i=1}^n (\lambda-\lambda_i)\),则 \(\prod\limits_{i=1}^n\lambda_i=|A|,\sum\limits_{i=1}^n\lambda_i=\operatorname{tr}(A)\)
定理 5.7(\(\text{Hamilton-Cayley}\) 定理)

\(A\)\(P\) 上的一个 \(n\) 阶方阵,\(f(\lambda)=|\lambda E-A|\)\(A\) 的特征多项式,则

\[f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E =0 \]

利用此性质可以将任意一个关于 \(A\) 的多项式化简为不超过 \(n-1\) 次的多项式。

证明见 Hamilton-Cayley 定理

注意,此处的 \(f(A)\) 不能简单认为是 \(|A E-A|\),实际上,

\[f(A)= \left| \begin{bmatrix} A&O&\cdots&O\\ O&A&\cdots&O\\ \cdots&\cdots&\cdots&\cdots\\ O&O&\cdots&A\\ \end{bmatrix} - \begin{bmatrix} a_{11}E&a_{12}E&\cdots&a_{1n}E\\ a_{21}E&a_{22}E&\cdots&a_{2n}E\\ \cdots&\cdots&\cdots&\cdots\\ a_{n1}E&a_{n2}E&\cdots&a_{nn}E\\ \end{bmatrix} \right| \]

5.3.4 特征向量的线性无关性

定理 5.8

属于不同特征值的特征向量是线性无关的

有以下推论:

定理 5.9

\(A\) 的不同特征值 \(\lambda_1,\lambda_2,\cdots,\lambda_k\),若 \(X_{i1},X_{i2},\cdots,X_{ir_i}(i\in[k])\) 是属于特征值 \(\lambda_i(i\in[k])\) 的线性无关的特征向量组,则向量组

\[X_{11},X_{12},\cdots,X_{1r_1},X_{21},X_{22},\cdots,X_{2r_2},\cdots,X_{k1},X_{k2},\cdots,X_{kr_k} \]

是线性无关的,证明见特征向量线性的无关性

5.4 矩阵的对角化

定理 5.10

\(n\) 阶矩阵 \(A\) 与对角阵相似 \(\Longleftrightarrow\) \(A\)\(n\) 个线性无关的特征向量

给出一个构造性的证明

\(B=\operatorname{diag}[\lambda_1,\lambda_2,\cdots,\lambda_n]\sim A\),则 \(\exists P\) 使得 \(B=P^{-1}AP\)

可以发现,

\[\begin{aligned} PB&=AP\\ [X_1,X_2,\cdots,X_n]\operatorname{diag}[\lambda_1,\lambda_2,\cdots,\lambda_n]&=A[X_1,X_2\cdots,X_n]\\ [\lambda_1X_1,\lambda_2X_2,\cdots,\lambda_nX_n]&=[AX_1,AX_2,\cdots,AX_n] \end{aligned} \]

从而 \(\lambda_iX_i=AX_i\) ,从而 \(X_i\)\(A\) 的特征向量,又 \(P\) 可逆,于是有 \(A\)\(n\) 个特征向量 \(X_1,X_2,\cdots,X_n\)

推论

  • 一个 \(n\) 阶方阵 \(A\),如果它有 \(n\) 个不同的特征值,则 \(A\) 一定可以对角化

5.5 化对称矩阵为对角阵

实对称矩阵都可以被化为对角阵

定理 5.11

实对称阵的特征多项式的根都是实数,证明见 定理 5.11

定理 5.12

实对称矩阵属于不同特征值的特征向量是正交的,证明见 定理 5.12

定理 5.13

实对称阵一定正交相似于一个对角阵,证明见 定理 5.13

下面给出一种构造方案:

  1. 求出 \(A\) 的特征根 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)
  2. 求出每个特征根 \(\lambda_1\) 对应的基础解系 \(\varepsilon_{i1},\varepsilon_{i2},\cdots,\varepsilon_{ir_i}\),并作施密特正交化,单位化
  3. 一共 \(n\) 个向量将其拼接得到 \(P\) 即可

5.6 正交变换

定义 5.8

正交变换是保持内积的线性变换,即 \(\forall \alpha,\beta\)\((T(\alpha),T(\beta))=(\alpha,\beta)\)

事实上,这等价于保持长度的线性变换

定理 5.14

\(T\)\(n\) 维度欧式空间的一个线性变换,如下四个命题等价:

  1. \(T\) 是正交变换
  2. \(\forall\alpha\in V,\Vert T(\alpha)\Vert=\Vert\alpha\Vert\)
  3. \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是标准正交基,则 \(T(\varepsilon_1),T(\varepsilon_2),\cdots,T(\varepsilon_n)\) 也是标准正交基
  4. \(T\) 在任意一个标准正交基下的矩阵是正交矩阵

由第四条,我们知道正交变换的矩阵 \(A\) 是正交矩阵,因此有 \(|A|=\pm1\)

我们称 \(|A|=1\) 的正交变换为第一类正交变换\(|A|=-1\) 的为第二类正交变换

比如,\(T_\theta\) 是第一类,按照 \(x\) 轴反射变换是第二类

posted @ 2025-01-14 00:36  思考人生中…  阅读(450)  评论(0)    收藏  举报