线性空间
这是高等代数中线性(向量)空间的标准公理化定义,出自国内主流高等代数教材的核心章节。这个定义是整个线性代数理论体系的基石,标志着代数学从"具体计算"向"抽象结构"的根本转变。下面我从定义深度解读、关键易错点、反例构造、代数思想升华四个维度为你展开讲解:
一、定义的公理化结构深度解析
这个定义采用了现代代数学的标准公理化表述,将线性空间分解为两个代数结构的组合:
-
加法结构:((V, +)) 构成一个阿贝尔群(交换群)
- 交换律和结合律保证了加法运算的基本性质
- 零元素是群的单位元,负元素是群的逆元
- 群的四条公理是线性空间加法运算的全部要求
-
数乘结构:域 (F) 对集合 (V) 的一个作用,满足四条相容性条件
- (1)(2) 是数乘与加法的分配律,连接了数乘与加法两种运算
- (3) 是数乘与域乘法的结合律,连接了数乘与域的乘法
- (4) 是数乘的单位元性质,保证了数乘的"非平凡性"
核心洞察:线性空间不是一个简单的集合,而是"集合+两种运算+八条公理"构成的代数结构。同一个集合上定义不同的加法或数乘运算,可以得到完全不同的线性空间。
二、教材中未明确强调的关键要点
-
运算的封闭性是定义的前提
定义中"对任意 (x,y \in V),唯一定义有 (z \in V) 与之对应"和"对任意 (\lambda \in F, x \in V),唯一定义有 (y \in V) 与之对应",这两句话就是运算封闭性的严格表述。- 易错点:很多学生在判断线性空间时,只验证八条公理,却忽略了封闭性。实际上,封闭性是比公理更基础的要求。
-
基域 (F) 是线性空间不可分割的一部分
同一个集合在不同的基域上可以是不同维数的线性空间:- 复数域 (\mathbb{C}) 作为实数域 (\mathbb{R}) 上的线性空间是2维的,基为 ({1, i})
- 复数域 (\mathbb{C}) 作为自身上的线性空间是1维的,基为 ({1})
- 重要结论:线性空间的所有性质都依赖于基域,包括维数、线性相关性、多项式的可约性等。
-
零元和负元的唯一性
教材中没有直接给出证明,但这是线性空间的基本性质:- 零元唯一:若 (0_1, 0_2) 都是零元,则 (0_1 = 0_1 + 0_2 = 0_2)
- 负元唯一:若 (y_1, y_2) 都是 (x) 的负元,则 (y_1 = y_1 + 0 = y_1 + (x + y_2) = (y_1 + x) + y_2 = 0 + y_2 = y_2)
-
几个重要的推论
从定义可以直接推出:- 对任意 (x \in V),有 (0 \cdot x = 0)
- 对任意 (\lambda \in F),有 (\lambda \cdot 0 = 0)
- 对任意 (x \in V),有 ((-1) \cdot x = -x)
- 若 (\lambda x = 0),则 (\lambda = 0) 或 (x = 0)
三、经典反例构造(帮助理解定义边界)
-
不满足封闭性的例子
- 集合 (V = \mathbb{R}^2),加法按分量定义,数乘定义为 (\lambda(x, y) = (\lambda x, 0))
- 不满足 (1 \cdot x = x)(当 (y \neq 0) 时,(1 \cdot (x, y) = (x, 0) \neq (x, y)))
- 集合 (V = { (x, y) \in \mathbb{R}^2 \mid x \geq 0 }),加法和数乘按分量定义
- 数乘不封闭:取 (x = (1, 0)),(\lambda = -1),则 (\lambda x = (-1, 0) \notin V)
- 集合 (V = \mathbb{R}^2),加法按分量定义,数乘定义为 (\lambda(x, y) = (\lambda x, 0))
-
不满足加法交换律的例子
- 集合 (V = \mathbb{R}^2),加法定义为 ((x_1, y_1) + (x_2, y_2) = (x_1 + x_2, y_1 - y_2))
- 不满足交换律:((1, 2) + (3, 4) = (4, -2)),而 ((3, 4) + (1, 2) = (4, 2))
- 集合 (V = \mathbb{R}^2),加法定义为 ((x_1, y_1) + (x_2, y_2) = (x_1 + x_2, y_1 - y_2))
-
不满足分配律的例子
- 集合 (V = \mathbb{R}^2),加法按分量定义,数乘定义为 (\lambda(x, y) = (\lambda^2 x, \lambda^2 y))
- 不满足 ((\lambda + \mu)x = \lambda x + \mu x):取 (\lambda = 1, \mu = 1, x = (1, 1)),则左边 ((2)(1,1) = (4,4)),右边 ((1,1) + (1,1) = (2,2))
- 集合 (V = \mathbb{R}^2),加法按分量定义,数乘定义为 (\lambda(x, y) = (\lambda^2 x, \lambda^2 y))
四、代数思想升华
线性空间的公理化定义是代数学"结构主义"思想的第一个完美体现:
- 抽象化:不再局限于具体的几何向量或数组,而是将所有具有线性性质的对象统一到一个框架下
- 公理化:用最少的公理刻画最本质的性质,使得理论具有最大的普适性
- 结构观:将研究对象视为一个整体结构,而不是孤立元素的集合
- 不变量思想:后续的维数、秩、行列式、特征值等概念,本质上都是线性空间在各种变换下的不变量
后续课程衔接:这个定义将直接推广到抽象代数中的模(将基域 (F) 换成环 (R)),以及泛函分析中的巴拿赫空间和希尔伯特空间(在线性空间基础上增加范数和内积结构)。
这是线性空间理论中最基础、最重要的原型例子——n元数组空间,它是所有有限维线性空间的"标准模型"。下面我将为你进行严格的公理化验证,并深入讲解其核心地位、基与维数、以及与后续理论的联系。
一、严格证明:(F^n) 是域 (F) 上的线性空间
设 (F) 是任意域,定义集合
[F^n = { (a_1, a_2, \dots, a_n) \mid a_i \in F, , i=1,2,\dots,n }]
在 (F^n) 上定义两种运算:
- 加法:对任意 (\alpha = (a_1, \dots, a_n)),(\beta = (b_1, \dots, b_n) \in F^n),
[\alpha + \beta = (a_1 + b_1, a_2 + b_2, \dots, a_n + b_n)] - 数乘:对任意 (\lambda \in F),(\alpha = (a_1, \dots, a_n) \in F^n),
[\lambda \alpha = (\lambda a_1, \lambda a_2, \dots, \lambda a_n)]
下面逐条验证线性空间的八条公理:
1. 加法构成阿贝尔群
(1) 交换律:
[\alpha + \beta = (a_1 + b_1, \dots, a_n + b_n) = (b_1 + a_1, \dots, b_n + a_n) = \beta + \alpha]
依据:域 (F) 中加法交换律。
(2) 结合律:
[(\alpha + \beta) + \gamma = (a_1 + b_1 + c_1, \dots, a_n + b_n + c_n) = \alpha + (\beta + \gamma)]
依据:域 (F) 中加法结合律。
(3) 零元存在性:
取零向量 (0 = (0, 0, \dots, 0)),则对任意 (\alpha \in F^n),
[0 + \alpha = (0 + a_1, \dots, 0 + a_n) = (a_1, \dots, a_n) = \alpha]
依据:域 (F) 中零元性质。
(4) 负元存在性:
对任意 (\alpha = (a_1, \dots, a_n)),取 (-\alpha = (-a_1, \dots, -a_n)),则
[\alpha + (-\alpha) = (a_1 - a_1, \dots, a_n - a_n) = (0, \dots, 0) = 0]
依据:域 (F) 中负元性质。
2. 数乘满足四条相容性
(1) 数乘对向量加法的分配律:
[\lambda(\alpha + \beta) = \lambda(a_1 + b_1, \dots, a_n + b_n) = (\lambda a_1 + \lambda b_1, \dots, \lambda a_n + \lambda b_n) = \lambda \alpha + \lambda \beta]
依据:域 (F) 中乘法对加法的分配律。
(2) 数乘对域加法的分配律:
[(\lambda + \mu)\alpha = ((\lambda + \mu)a_1, \dots, (\lambda + \mu)a_n) = (\lambda a_1 + \mu a_1, \dots, \lambda a_n + \mu a_n) = \lambda \alpha + \mu \alpha]
依据:域 (F) 中乘法对加法的分配律。
(3) 数乘结合律:
[(\lambda \mu)\alpha = ((\lambda \mu)a_1, \dots, (\lambda \mu)a_n) = (\lambda(\mu a_1), \dots, \lambda(\mu a_n)) = \lambda(\mu \alpha)]
依据:域 (F) 中乘法结合律。
(4) 数乘单位元:
[1 \cdot \alpha = (1 \cdot a_1, \dots, 1 \cdot a_n) = (a_1, \dots, a_n) = \alpha]
依据:域 (F) 中乘法单位元性质。
综上,(F^n) 满足线性空间的全部八条公理,因此是域 (F) 上的线性空间。
二、行向量空间与列向量空间的关系
教材中提到的"n数组列向量集 (F^{(n)})",是指所有n元列向量构成的集合:
[F^{(n)} = \left{ \begin{pmatrix} a_1 \ a_2 \ \vdots \ a_n \end{pmatrix} \mid a_i \in F \right}]
其加法和数乘同样按分量进行。
核心结论:
- (F^n)(行向量空间)与 (F^{(n)})(列向量空间)作为线性空间是同构的,同构映射为转置运算:
[\varphi: F^n \rightarrow F^{(n)}, \quad \varphi((a_1, \dots, a_n)) = \begin{pmatrix} a_1 \ \vdots \ a_n \end{pmatrix}] - 它们的区别仅在于写法不同,在矩阵乘法中扮演不同角色:行向量左乘矩阵,列向量右乘矩阵。
- 后续理论中,我们通常将向量视为列向量,这样线性变换 (T) 作用于向量 (x) 可以表示为矩阵乘法 (Ax),形式更简洁。
三、(F^n) 的基与维数
标准基(自然基):在 (F^n) 中,定义向量
[\varepsilon_1 = (1, 0, 0, \dots, 0), \quad \varepsilon_2 = (0, 1, 0, \dots, 0), \quad \dots, \quad \varepsilon_n = (0, 0, 0, \dots, 1)]
其中 (\varepsilon_i) 是第 (i) 个分量为1,其余分量为0的向量。
证明 (\varepsilon_1, \dots, \varepsilon_n) 是 (F^n) 的一组基:
-
线性无关性:设存在 (k_1, \dots, k_n \in F),使得
[k_1\varepsilon_1 + k_2\varepsilon_2 + \dots + k_n\varepsilon_n = 0]
即
[(k_1, k_2, \dots, k_n) = (0, 0, \dots, 0)]
故 (k_1 = k_2 = \dots = k_n = 0),因此 (\varepsilon_1, \dots, \varepsilon_n) 线性无关。 -
生成性:对任意 (\alpha = (a_1, a_2, \dots, a_n) \in F^n),有
[\alpha = a_1\varepsilon_1 + a_2\varepsilon_2 + \dots + a_n\varepsilon_n]
即 (\alpha) 可由 (\varepsilon_1, \dots, \varepsilon_n) 线性表示。
因此,(\varepsilon_1, \dots, \varepsilon_n) 是 (F^n) 的一组基,称为标准基,且 (\dim F^n = n)。
四、(F^n) 的核心地位与理论意义
(F^n) 是线性空间理论的标准模型,其核心地位体现在以下基本定理:
线性空间表示定理:数域 (F) 上任意一个 (n) 维线性空间 (V) 都与 (F^n) 同构。
证明思路:取 (V) 的一组基 (\alpha_1, \dots, \alpha_n),定义映射
[\varphi: V \rightarrow F^n, \quad \varphi(\alpha) = (x_1, x_2, \dots, x_n)^T]
其中 (\alpha = x_1\alpha_1 + x_2\alpha_2 + \dots + x_n\alpha_n) 是 (\alpha) 在基 (\alpha_1, \dots, \alpha_n) 下的坐标。可以证明 (\varphi) 是双射线性映射,即同构映射。
深刻意义:
- 这个定理告诉我们,所有n维线性空间在代数结构上是完全相同的,它们的区别仅在于元素的具体形式。
- 这意味着我们可以将任意n维线性空间中的问题,通过坐标映射转化为 (F^n) 中的问题来研究。
- 这就是为什么矩阵理论能够成为线性代数的核心工具:线性变换可以用矩阵表示,向量可以用坐标表示,线性变换的作用可以用矩阵乘法表示。
五、常见易错点与注意事项
-
有序数组的顺序性:((a_1, a_2, \dots, a_n)) 是有序数组,顺序不同表示不同的向量。例如 ((1, 2)) 和 ((2, 1)) 是 (\mathbb{R}^2) 中两个不同的向量。
-
基域的影响:同一个集合在不同基域上是不同的线性空间。例如:
- (\mathbb{R}^n) 是实数域上的n维线性空间
- (\mathbb{C}^n) 是复数域上的n维线性空间
- (\mathbb{C}^n) 作为实数域上的线性空间是2n维的
-
零向量的唯一性:(F^n) 中的零向量是唯一的,即 ((0, 0, \dots, 0)),不要与数域中的零元混淆。
-
子空间的例子:(F^n) 有很多重要的子空间,例如:
- 齐次线性方程组 (Ax = 0) 的解空间 (N(A) = { x \in F^n \mid Ax = 0 }),维数为 (n - \operatorname{rank}(A))
- 矩阵 (A) 的列空间 (R(A) = \operatorname{span}{A_1, \dots, A_n}),维数为 (\operatorname{rank}(A))
六、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| n元数组空间 (F^n) | 按分量定义加法和数乘,构成域F上的n维线性空间 | 所有有限维线性空间的标准模型 | 忽略数组的顺序性;混淆行向量与列向量 |
| 标准基 (\varepsilon_1, \dots, \varepsilon_n) | 第i个分量为1,其余为0;线性无关且生成整个空间 | 向量的坐标表示;矩阵的标准基表示 | 认为基是唯一的 |
| 线性空间表示定理 | 任意n维线性空间都与 (F^n) 同构 | 将抽象线性空间问题转化为矩阵问题 | 忽略基的选择对同构映射的影响 |
这是线性空间理论中第二个核心原型例子——矩阵空间,它是连接抽象线性变换与具体矩阵运算的桥梁。下面我将为你进行严格的公理化验证,并深入讲解其基与维数、重要子空间、以及与线性映射空间的同构关系。
一、严格证明:(M_{m \times n}(F)) 是域 (F) 上的线性空间
设 (F) 是任意域,定义集合
[M_{m \times n}(F) = \left{ A = (a_{ij}){m \times n} \mid a \in F, , 1 \leq i \leq m, , 1 \leq j \leq n \right}]
即域 (F) 上所有 (m \times n) 矩阵的全体。在 (M_{m \times n}(F)) 上定义两种运算:
- 加法:对任意 (A = (a_{ij}), B = (b_{ij}) \in M_{m \times n}(F)),
[A + B = (a_{ij} + b_{ij})_{m \times n}]
即对应位置元素相加。 - 数乘:对任意 (\lambda \in F),(A = (a_{ij}) \in M_{m \times n}(F)),
[\lambda A = (\lambda a_{ij})_{m \times n}]
即每个元素都乘以数 (\lambda)。
下面逐条验证线性空间的八条公理:
1. 加法构成阿贝尔群
(1) 交换律:
[A + B = (a_{ij} + b_{ij}) = (b_{ij} + a_{ij}) = B + A]
依据:域 (F) 中加法交换律。
(2) 结合律:
[(A + B) + C = (a_{ij} + b_{ij} + c_{ij}) = A + (B + C)]
依据:域 (F) 中加法结合律。
(3) 零元存在性:
取零矩阵 (O = (0){m \times n})(所有元素都是0的矩阵),则对任意 (A \in M(F)),
[O + A = (0 + a_{ij}) = (a_{ij}) = A]
依据:域 (F) 中零元性质。
(4) 负元存在性:
对任意 (A = (a_{ij})),取 (-A = (-a_{ij})),则
[A + (-A) = (a_{ij} - a_{ij}) = (0) = O]
依据:域 (F) 中负元性质。
2. 数乘满足四条相容性
(1) 数乘对矩阵加法的分配律:
[\lambda(A + B) = \lambda(a_{ij} + b_{ij}) = (\lambda a_{ij} + \lambda b_{ij}) = \lambda A + \lambda B]
依据:域 (F) 中乘法对加法的分配律。
(2) 数乘对域加法的分配律:
[(\lambda + \mu)A = ((\lambda + \mu)a_{ij}) = (\lambda a_{ij} + \mu a_{ij}) = \lambda A + \mu A]
依据:域 (F) 中乘法对加法的分配律。
(3) 数乘结合律:
[(\lambda \mu)A = ((\lambda \mu)a_{ij}) = (\lambda(\mu a_{ij})) = \lambda(\mu A)]
依据:域 (F) 中乘法结合律。
(4) 数乘单位元:
[1 \cdot A = (1 \cdot a_{ij}) = (a_{ij}) = A]
依据:域 (F) 中乘法单位元性质。
综上,(M_{m \times n}(F)) 满足线性空间的全部八条公理,因此是域 (F) 上的线性空间。
二、矩阵空间的基与维数
定义(矩阵单位):在 (M_{m \times n}(F)) 中,定义矩阵 (E_{ij}) 为第 (i) 行第 (j) 列元素为1,其余元素为0的矩阵,即
[E_{ij} = \begin{pmatrix}
0 & \dots & 0 & \dots & 0 \
\vdots & & \vdots & & \vdots \
0 & \dots & 1 & \dots & 0 \
\vdots & & \vdots & & \vdots \
0 & \dots & 0 & \dots & 0
\end{pmatrix} \quad \text{(第i行第j列是1)}]
定理:矩阵单位组 ({ E_{ij} \mid 1 \leq i \leq m, , 1 \leq j \leq n }) 是 (M_{m \times n}(F)) 的一组基,因此
[\dim M_{m \times n}(F) = mn]
证明:
-
线性无关性:设存在 (k_{ij} \in F),使得
[\sum_{i=1}^m \sum_{j=1}^n k_{ij} E_{ij} = O]
左边的矩阵在第 (i) 行第 (j) 列的元素恰好是 (k_{ij}),右边零矩阵的所有元素都是0,因此对所有 (i,j),有 (k_{ij} = 0)。故矩阵单位组线性无关。 -
生成性:对任意 (A = (a_{ij}) \in M_{m \times n}(F)),显然有
[A = \sum_{i=1}^m \sum_{j=1}^n a_{ij} E_{ij}]
即任意矩阵都可表示为矩阵单位的线性组合。
因此,矩阵单位组是 (M_{m \times n}(F)) 的一组基,维数为 (mn)。
三、矩阵空间的重要子空间
当 (m = n) 时,(M_n(F)) 是 (n) 阶方阵空间,它有几个非常重要的子空间:
1. 对称矩阵空间 (S_n(F))
[S_n(F) = { A \in M_n(F) \mid A^T = A }]
- 基:({ E_{ii} \mid 1 \leq i \leq n } \cup { E_{ij} + E_{ji} \mid 1 \leq i < j \leq n })
- 维数:(\dim S_n(F) = n + \frac{n(n-1)}{2} = \frac{n(n+1)}{2})
2. 反对称矩阵空间 (A_n(F))
[A_n(F) = { A \in M_n(F) \mid A^T = -A }]
- 基:({ E_{ij} - E_{ji} \mid 1 \leq i < j \leq n })
- 维数:(\dim A_n(F) = \frac{n(n-1)}{2})
3. 上三角矩阵空间 (T_n(F))
[T_n(F) = { A = (a_{ij}) \in M_n(F) \mid a_{ij} = 0, , \forall i > j }]
- 基:({ E_{ij} \mid 1 \leq i \leq j \leq n })
- 维数:(\dim T_n(F) = \frac{n(n+1)}{2})
4. 下三角矩阵空间 (L_n(F))
[L_n(F) = { A = (a_{ij}) \in M_n(F) \mid a_{ij} = 0, , \forall i < j }]
- 基:({ E_{ij} \mid 1 \leq j \leq i \leq n })
- 维数:(\dim L_n(F) = \frac{n(n+1)}{2})
重要直和分解:
[M_n(F) = S_n(F) \oplus A_n(F)]
证明:
- 对任意 (A \in M_n(F)),有 (A = \frac{A + A^T}{2} + \frac{A - A^T}{2}),其中 (\frac{A + A^T}{2} \in S_n(F)),(\frac{A - A^T}{2} \in A_n(F)),故 (M_n(F) = S_n(F) + A_n(F))。
- 若 (A \in S_n(F) \cap A_n(F)),则 (A^T = A) 且 (A^T = -A),故 (A = -A),即 (2A = O),因此 (A = O)(在特征不为2的域上)。
由直和判定定理,(M_n(F) = S_n(F) \oplus A_n(F))。
四、矩阵空间的核心理论意义
矩阵空间的根本重要性体现在以下线性代数基本同构定理:
定理:设 (V) 是域 (F) 上的 (n) 维线性空间,(W) 是域 (F) 上的 (m) 维线性空间,(\operatorname{Hom}_F(V, W)) 是从 (V) 到 (W) 的所有线性映射构成的集合。则
[\operatorname{Hom}F(V, W) \cong M(F)]
即线性映射空间与矩阵空间作为线性空间是同构的。
证明思路:
- 分别取 (V) 的一组基 (\alpha_1, \dots, \alpha_n) 和 (W) 的一组基 (\beta_1, \dots, \beta_m)。
- 对任意线性映射 (T \in \operatorname{Hom}F(V, W)),定义它在这两组基下的矩阵 (A = (a){m \times n}),其中
[T(\alpha_j) = \sum^m a_{ij} \beta_i, \quad j = 1, \dots, n] - 可以证明这个对应关系是双射线性映射,即同构映射。
深刻意义:
- 这个定理建立了抽象线性变换与具体矩阵之间的一一对应关系。
- 线性映射的加法对应矩阵的加法,线性映射的数乘对应矩阵的数乘,线性映射的复合对应矩阵的乘法。
- 这就是为什么矩阵理论能够成为研究线性变换的核心工具:所有关于线性变换的问题都可以转化为矩阵问题来解决。
五、常见易错点与注意事项
-
维数计算错误:很多学生容易误以为 (M_{m \times n}(F)) 的维数是 (m + n) 或 (\max(m, n)),实际上是 (mn),因为有 (mn) 个独立的矩阵单位。
-
特征为2的域上的特殊情况:在特征为2的域上,(2A = O) 不能推出 (A = O),因此 (M_n(F) = S_n(F) \oplus A_n(F)) 不成立。
-
矩阵单位的定义:注意 (E_{ij}) 是第 (i) 行第 (j) 列元素为1,不要搞反行和列的顺序。
-
子空间的验证:验证一个矩阵集合是子空间时,只需验证对加法和数乘封闭即可,例如对称矩阵的和仍是对称矩阵,数乘对称矩阵仍是对称矩阵。
六、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| 矩阵空间 (M_{m \times n}(F)) | 按元素定义加法和数乘,维数为 (mn) | 线性变换的矩阵表示 | 维数计算错误;混淆行和列 |
| 矩阵单位 (E_{ij}) | 第i行第j列元素为1,其余为0;构成矩阵空间的基 | 矩阵的分解;线性映射的矩阵表示 | 搞反行和列的顺序 |
| 对称/反对称矩阵空间 | 维数分别为 (n(n+1)/2) 和 (n(n-1)/2);直和分解为全矩阵空间 | 矩阵的对称-反对称分解 | 特征为2的域上直和不成立 |
| 线性映射空间同构 | (\operatorname{Hom}F(V, W) \cong M(F)) | 将抽象线性变换问题转化为矩阵问题 | 基的选择影响矩阵表示 |
这是线性空间理论中连接高等代数与抽象代数的关键例子——域扩张作为线性空间,它标志着线性代数思想开始向更一般的代数结构渗透。下面我将为你进行严格的公理化验证,并深入讲解每个具体例子的基与维数、核心理论意义,以及与域论的深刻联系。
一、一般结论的严格证明
定理:设 (E) 是域 (F) 的扩域(即 (F \subseteq E) 且 (E) 本身是域),则按 (E) 中的加法和乘法,(E) 构成 (F) 上的线性空间。
证明:我们逐条验证线性空间的八条公理:
1. 加法构成阿贝尔群
因为 (E) 是域,所以 ((E, +)) 本身就是阿贝尔群,自然满足:
- 交换律:(a + b = b + a)
- 结合律:((a + b) + c = a + (b + c))
- 零元存在性:(E) 中的零元 (0) 就是线性空间的零元
- 负元存在性:对任意 (a \in E),(-a \in E) 就是其负元
2. 数乘满足四条相容性
定义数乘运算为 (E) 中的乘法:对任意 (\lambda \in F),(a \in E),(\lambda \cdot a = \lambda a)(域 (E) 中的乘法)。
- 数乘对向量加法的分配律:(\lambda(a + b) = \lambda a + \lambda b)(域 (E) 中乘法对加法的分配律)
- 数乘对域加法的分配律:((\lambda + \mu)a = \lambda a + \mu a)(域 (E) 中乘法对加法的分配律)
- 数乘结合律:((\lambda \mu)a = \lambda(\mu a))(域 (E) 中乘法结合律)
- 数乘单位元:(1 \cdot a = a)(域 (E) 中乘法单位元性质)
综上,(E) 满足线性空间的全部八条公理,因此是 (F) 上的线性空间。□
二、四个具体例子的详细解析
例1:复数域 (\mathbb{C}) 作为实数域 (\mathbb{R}) 上的线性空间
- 基:({1, i})
- 维数:(\dim_{\mathbb{R}} \mathbb{C} = 2)
证明:
- 线性无关性:设存在 (a, b \in \mathbb{R}),使得 (a \cdot 1 + b \cdot i = 0)。根据复数相等的定义,实部和虚部分别相等,故 (a = 0) 且 (b = 0),因此 ({1, i}) 线性无关。
- 生成性:对任意复数 (z \in \mathbb{C}),都可以唯一表示为 (z = a + bi),其中 (a, b \in \mathbb{R}),即 (z) 可由 ({1, i}) 线性表示。
重要说明:同一个集合在不同基域上是完全不同的线性空间。例如,(\mathbb{C}) 作为自身上的线性空间是1维的,基为 ({1})。
例2:二次扩域 (\mathbb{Q}(\sqrt{2})) 作为有理数域 (\mathbb{Q}) 上的线性空间
(\mathbb{Q}(\sqrt{2}) = {a + b\sqrt{2} \mid a, b \in \mathbb{Q}}) 是包含有理数域 (\mathbb{Q}) 和元素 (\sqrt{2}) 的最小域。
- 基:({1, \sqrt{2}})
- 维数:(\dim_{\mathbb{Q}} \mathbb{Q}(\sqrt{2}) = 2)
证明:
- 线性无关性:设存在 (a, b \in \mathbb{Q}),使得 (a + b\sqrt{2} = 0)。若 (b \neq 0),则 (\sqrt{2} = -a/b \in \mathbb{Q}),与 (\sqrt{2}) 是无理数矛盾。故 (b = 0),从而 (a = 0),因此 ({1, \sqrt{2}}) 线性无关。
- 生成性:由 (\mathbb{Q}(\sqrt{2})) 的定义,任意元素都可表示为 (a + b\sqrt{2}),即由 ({1, \sqrt{2}}) 线性表示。
例3:实数域 (\mathbb{R}) 作为有理数域 (\mathbb{Q}) 上的线性空间
- 维数:无限维
证明:反证法。假设 (\mathbb{R}) 是 (\mathbb{Q}) 上的有限维线性空间,维数为 (n)。则 (\mathbb{R}) 中任意 (n+1) 个元素必线性相关。但我们可以找到无限多个在 (\mathbb{Q}) 上线性无关的实数,例如:
[1, \pi, \pi^2, \pi^3, \dots]
这是因为 (\pi) 是超越数,不存在非零有理系数多项式 (f(x)) 使得 (f(\pi) = 0)。因此 (\mathbb{R}) 作为 (\mathbb{Q}) 上的线性空间是无限维的。
例4:单代数扩张 (\mathbb{Q}(\theta)) 作为有理数域 (\mathbb{Q}) 上的线性空间
设 (p(x)) 是 (\mathbb{Q}) 上的 (n) 次不可约多项式,(\theta) 是 (p(x)) 的一个复根,则
[\mathbb{Q}(\theta) = {a_0 + a_1\theta + a_2\theta^2 + \dots + a_{n-1}\theta^{n-1} \mid a_0, a_1, \dots, a_{n-1} \in \mathbb{Q}}]
是包含 (\mathbb{Q}) 和 (\theta) 的最小域。
- 基:({1, \theta, \theta^2, \dots, \theta^{n-1}})
- 维数:(\dim_{\mathbb{Q}} \mathbb{Q}(\theta) = n)
证明:
-
线性无关性:设存在 (a_0, a_1, \dots, a_{n-1} \in \mathbb{Q}),使得
[a_0 + a_1\theta + \dots + a_{n-1}\theta^{n-1} = 0]
令 (f(x) = a_0 + a_1x + \dots + a_{n-1}x^{n-1}),则 (f(\theta) = 0)。如果 (f(x) \neq 0),则 (f(x)) 是次数小于 (n) 的非零多项式,且与不可约多项式 (p(x)) 有公共根 (\theta),故 (p(x) \mid f(x)),但 (\deg p(x) = n > \deg f(x)),矛盾。因此 (f(x) = 0),即 (a_0 = a_1 = \dots = a_{n-1} = 0),故 ({1, \theta, \dots, \theta^{n-1}}) 线性无关。 -
生成性:对任意 (\alpha \in \mathbb{Q}(\theta)),(\alpha) 可表示为 (\theta) 的有理系数多项式 (\alpha = g(\theta))。由多项式带余除法,存在唯一的多项式 (q(x), r(x) \in \mathbb{Q}[x]),使得
[g(x) = q(x)p(x) + r(x), \quad \deg r(x) < n]
因为 (p(\theta) = 0),所以 (\alpha = g(\theta) = r(\theta)),即 (\alpha) 可表示为 (1, \theta, \dots, \theta^{n-1}) 的线性组合。
重要说明:前面的例1和例2都是这个一般结论的特例:
- 例1:(p(x) = x^2 + 1),(\theta = i),(\dim_{\mathbb{R}} \mathbb{C} = 2)
- 例2:(p(x) = x^2 - 2),(\theta = \sqrt{2}),(\dim_{\mathbb{Q}} \mathbb{Q}(\sqrt{2}) = 2)
三、核心理论意义:域扩张的次数
定义(域扩张的次数):设 (E) 是 (F) 的扩域,(E) 作为 (F) 上线性空间的维数称为域扩张 (E/F) 的次数,记作 ([E:F])。如果 ([E:F]) 有限,则称 (E/F) 是有限扩张;否则称为无限扩张。
域扩张次数公式(望远镜公式):设 (F \subseteq E \subseteq K) 是域扩张,则
[[K:F] = [K:E] \cdot [E:F]]
证明思路:取 (E/F) 的一组基 (\alpha_1, \dots, \alpha_m) 和 (K/E) 的一组基 (\beta_1, \dots, \beta_n),则 ({\alpha_i \beta_j \mid 1 \leq i \leq m, 1 \leq j \leq n}) 是 (K/F) 的一组基,因此 ([K:F] = mn = [K:E] \cdot [E:F])。
深刻意义:
- 这个定理将域论中的扩张次数与线性空间的维数联系起来,是域论中最基本的定理之一。
- 它为研究域扩张提供了强有力的线性代数工具,许多域论中的深刻结论都可以通过线性代数方法证明。
- 例如,尺规作图问题的不可能性证明(如三等分角、倍立方体),本质上就是利用了域扩张次数的性质。
四、常见易错点与注意事项
-
基域的决定性作用:同一个域作为不同基域上的线性空间,维数可以完全不同。例如:
- ([\mathbb{C}:\mathbb{R}] = 2)
- ([\mathbb{C}:\mathbb{C}] = 1)
- ([\mathbb{C}:\mathbb{Q}] = \infty)
-
有限扩张与代数扩张的关系:有限扩张必是代数扩张,但代数扩张不一定是有限扩张。例如,所有代数数构成的域是 (\mathbb{Q}) 上的代数扩张,但它是无限维的。
-
不可约多项式的作用:单代数扩张 (\mathbb{Q}(\theta)) 的维数等于其极小多项式的次数,这里极小多项式必须是不可约的。如果多项式可约,则维数会小于多项式的次数。
-
超越扩张的无限维性:如果 (\theta) 是 (F) 上的超越数,则 (F(\theta)) 作为 (F) 上的线性空间是无限维的,基为 ({1, \theta, \theta^2, \dots})。
五、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| 域扩张作为线性空间 | 扩域E是基域F上的线性空间,维数称为扩张次数[E:F] | 域论中扩张次数的计算;尺规作图问题 | 忽略基域对维数的影响 |
| 单代数扩张 | (\mathbb{Q}(\theta)) 的维数等于极小多项式的次数n,基为 | 代数数域的构造与研究 | 混淆极小多项式与一般多项式 |
| 次数公式 | [K:F] = [K:E]·[E:F] | 复合扩张次数的计算;证明扩张的有限性 | 公式应用条件:F⊆E⊆K |
| 无限扩张 | 实数域R作为Q上的线性空间是无限维的;超越扩张是无限维的 | 区分代数扩张与超越扩张 | 误以为所有域扩张都是有限维的 |
这是线性空间理论中最具代表性的函数型例子——多项式空间,它是连接多项式理论与线性代数的桥梁,也是后续抽象代数中多项式环、模论的基础。下面我将为你进行严格的公理化验证,并深入讲解其基与维数、同构性质、重要子空间,以及与其他代数结构的深刻联系。
一、严格证明:(F[x]_n) 是域 (F) 上的线性空间
定义:设 (F) 是任意域,定义集合
[F[x]n = { f(x) = a_0 + a_1x + a_2x^2 + \dots + ax^{n-1} \mid a_0, a_1, \dots, a_{n-1} \in F }]
即域 (F) 上所有次数小于 (n) 的一元多项式的全体(包括零多项式)。
在 (F[x]_n) 上定义两种运算:
- 加法:对任意 (f(x) = \sum_{i=0}^{n-1} a_i x^i),(g(x) = \sum_{i=0}^{n-1} b_i x^i \in F[x]n),
[f(x) + g(x) = \sum^{n-1} (a_i + b_i) x^i]
即对应系数相加。 - 数乘:对任意 (\lambda \in F),(f(x) = \sum_{i=0}^{n-1} a_i x^i \in F[x]n),
[\lambda f(x) = \sum^{n-1} (\lambda a_i) x^i]
即每个系数都乘以数 (\lambda)。
下面逐条验证线性空间的八条公理:
1. 加法构成阿贝尔群
(1) 交换律:
[f(x) + g(x) = \sum_{i=0}^{n-1} (a_i + b_i) x^i = \sum_{i=0}^{n-1} (b_i + a_i) x^i = g(x) + f(x)]
依据:域 (F) 中加法交换律。
(2) 结合律:
[(f(x) + g(x)) + h(x) = \sum_{i=0}^{n-1} (a_i + b_i + c_i) x^i = f(x) + (g(x) + h(x))]
依据:域 (F) 中加法结合律。
(3) 零元存在性:
取零多项式 (0(x) = 0 + 0x + \dots + 0x^{n-1}),则对任意 (f(x) \in F[x]n),
[0(x) + f(x) = \sum^{n-1} (0 + a_i) x^i = f(x)]
依据:域 (F) 中零元性质。
(4) 负元存在性:
对任意 (f(x) = \sum_{i=0}^{n-1} a_i x^i),取 (-f(x) = \sum_{i=0}^{n-1} (-a_i) x^i),则
[f(x) + (-f(x)) = \sum_{i=0}^{n-1} (a_i - a_i) x^i = 0(x)]
依据:域 (F) 中负元性质。
2. 数乘满足四条相容性
(1) 数乘对多项式加法的分配律:
[\lambda(f(x) + g(x)) = \sum_{i=0}^{n-1} \lambda(a_i + b_i) x^i = \sum_{i=0}^{n-1} (\lambda a_i + \lambda b_i) x^i = \lambda f(x) + \lambda g(x)]
依据:域 (F) 中乘法对加法的分配律。
(2) 数乘对域加法的分配律:
[(\lambda + \mu)f(x) = \sum_{i=0}^{n-1} (\lambda + \mu)a_i x^i = \sum_{i=0}^{n-1} (\lambda a_i + \mu a_i) x^i = \lambda f(x) + \mu f(x)]
依据:域 (F) 中乘法对加法的分配律。
(3) 数乘结合律:
[(\lambda \mu)f(x) = \sum_{i=0}^{n-1} (\lambda \mu)a_i x^i = \sum_{i=0}^{n-1} \lambda(\mu a_i) x^i = \lambda(\mu f(x))]
依据:域 (F) 中乘法结合律。
(4) 数乘单位元:
[1 \cdot f(x) = \sum_{i=0}^{n-1} 1 \cdot a_i x^i = \sum_{i=0}^{n-1} a_i x^i = f(x)]
依据:域 (F) 中乘法单位元性质。
综上,(F[x]_n) 满足线性空间的全部八条公理,因此是域 (F) 上的线性空间。□
二、多项式空间的基与维数
标准基:在 (F[x]_n) 中,定义多项式组
[1, x, x^2, \dots, x^{n-1}]
定理:多项式组 ({1, x, x^2, \dots, x^{n-1}}) 是 (F[x]_n) 的一组基,因此
[\dim F[x]_n = n]
证明:
-
线性无关性:设存在 (a_0, a_1, \dots, a_{n-1} \in F),使得
[a_0 \cdot 1 + a_1 \cdot x + a_2 \cdot x^2 + \dots + a_{n-1} \cdot x^{n-1} = 0(x)]
根据多项式相等的定义,两个多项式相等当且仅当它们的对应系数全相等。右边零多项式的所有系数都是0,因此
[a_0 = a_1 = a_2 = \dots = a_{n-1} = 0]
故多项式组 ({1, x, \dots, x^{n-1}}) 线性无关。 -
生成性:对任意 (f(x) = a_0 + a_1x + \dots + a_{n-1}x^{n-1} \in F[x]n),显然有
[f(x) = a_0 \cdot 1 + a_1 \cdot x + \dots + a \cdot x^{n-1}]
即任意次数小于 (n) 的多项式都可表示为 ({1, x, \dots, x^{n-1}}) 的线性组合。
因此,({1, x, \dots, x^{n-1}}) 是 (F[x]_n) 的一组基,称为标准基,维数为 (n)。
三、多项式空间与数组空间的同构
定理:域 (F) 上的多项式空间 (F[x]_n) 与 (n) 元数组空间 (F^n) 作为线性空间是同构的。
证明:定义映射
[\varphi: F[x]n \rightarrow F^n, \quad \varphi(f(x)) = (a_0, a_1, \dots, a)^T]
其中 (f(x) = a_0 + a_1x + \dots + a_{n-1}x^{n-1}) 是多项式在标准基下的坐标。
-
线性性:对任意 (f(x), g(x) \in F[x]n),(\lambda \in F),
[\varphi(f(x) + g(x)) = (a_0 + b_0, \dots, a + b_{n-1})^T = \varphi(f(x)) + \varphi(g(x))]
[\varphi(\lambda f(x)) = (\lambda a_0, \dots, \lambda a_{n-1})^T = \lambda \varphi(f(x))]
故 (\varphi) 是线性映射。 -
双射性:显然 (\varphi) 是单射(不同多项式对应不同坐标)且是满射(任意数组都对应一个多项式),故 (\varphi) 是双射。
因此,(\varphi) 是同构映射,(F[x]_n \cong F^n)。□
深刻意义:
- 这个同构告诉我们,多项式本质上就是一个有序数组,多项式的加法和数乘对应数组的加法和数乘。
- 这使得我们可以将多项式问题转化为数组问题来研究,例如多项式的线性相关性等价于其系数向量的线性相关性。
- 这也是为什么我们可以用矩阵来表示多项式的运算,例如求导运算、积分运算都可以表示为矩阵乘法。
四、多项式空间的重要子空间
1. 次数小于 (k) 的多项式空间
[F[x]_k = { f(x) \in F[x]_n \mid \deg f(x) < k }, \quad 1 \leq k \leq n]
- 基:({1, x, \dots, x^{k-1}})
- 维数:(\dim F[x]_k = k)
2. 满足 (f(c) = 0) 的多项式空间
设 (c \in F),定义
[W = { f(x) \in F[x]_n \mid f(c) = 0 }]
- 基:({x - c, (x - c)^2, \dots, (x - c)^{n-1}})
- 维数:(\dim W = n - 1)
证明:对任意 (f(x) \in W),由多项式因式定理,(f(x) = (x - c)g(x)),其中 (g(x) \in F[x]_{n-1})。因此 (f(x)) 可表示为 ((x - c), \dots, (x - c)^{n-1}) 的线性组合,且这组多项式线性无关。
3. 偶多项式空间与奇多项式空间
设 (F) 是特征不为2的域,定义
- 偶多项式空间:(W_1 = { f(x) \in F[x]_n \mid f(-x) = f(x) })
- 奇多项式空间:(W_2 = { f(x) \in F[x]_n \mid f(-x) = -f(x) })
则有直和分解:
[F[x]_n = W_1 \oplus W_2]
- (W_1) 的基:({1, x^2, x^4, \dots}),维数为 (\lceil n/2 \rceil)
- (W_2) 的基:({x, x^3, x^5, \dots}),维数为 (\lfloor n/2 \rfloor)
五、常见易错点与注意事项
-
零多项式的特殊性:零多项式的次数规定为 (-\infty),因此它包含在 (F[x]_n) 中。不要误以为 (F[x]_n) 是次数为 (0, 1, \dots, n-1) 的多项式全体,这样会漏掉零多项式。
-
次数等于 (n) 的多项式不构成线性空间:集合 ({ f(x) \in F[x] \mid \deg f(x) = n }) 不是线性空间,因为加法不封闭。例如 (f(x) = x^n) 和 (g(x) = -x^n) 都是次数为 (n) 的多项式,但它们的和 (f(x) + g(x) = 0(x)) 次数小于 (n),不在集合中。
-
基的选择不唯一:除了标准基 ({1, x, \dots, x^{n-1}}),多项式空间还有很多其他基,例如拉格朗日插值基、牛顿插值基、切比雪夫多项式基等,不同的基在不同的应用场景中有各自的优势。
-
与单代数扩张的联系:之前讲的单代数扩张 (\mathbb{Q}(\theta)) 作为 (\mathbb{Q}) 上的线性空间与 (\mathbb{Q}[x]_n) 同构,其中 (n) 是极小多项式的次数。这是因为 (\mathbb{Q}(\theta) \cong \mathbb{Q}[x]/(p(x))),而商环 (\mathbb{Q}[x]/(p(x))) 中的每个元素都可以唯一表示为次数小于 (n) 的多项式。
六、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| 多项式空间 (F[x]_n) | 次数小于n的多项式全体,维数为n | 插值多项式;多项式运算的矩阵表示 | 漏掉零多项式;误以为次数等于n的多项式构成空间 |
| 标准基 ({1, x, \dots, x^{n-1}}) | 线性无关且生成整个空间;多项式的坐标就是其系数向量 | 多项式的线性相关性判定;坐标变换 | 混淆多项式的次数与系数的位置 |
| 与数组空间同构 | (F[x]_n \cong F^n),同构映射为取系数向量 | 将多项式问题转化为矩阵问题 | 忽略基的选择对同构映射的影响 |
| 重要子空间 | 次数小于k的多项式空间;满足f(c)=0的多项式空间 | 多项式插值;微分方程求解 | 子空间维数计算错误 |
这是线性空间理论中第一个也是最重要的无限维函数空间例子——连续函数空间,它是连接有限维线性代数与无限维泛函分析的桥梁,也是整个分析数学的基础。下面我将为你进行严格的公理化验证,重点讲解其无限维性的证明、重要子空间结构,以及与后续泛函分析课程的深刻联系。
一、严格证明:(C[a,b]) 是实数域 (\mathbb{R}) 上的线性空间
定义:设 ([a,b]) 是实数轴上的闭区间,定义集合
[C[a,b] = { f: [a,b] \rightarrow \mathbb{R} \mid f \text{ 在 } [a,b] \text{ 上连续} }]
即闭区间 ([a,b]) 上所有一元连续实函数的全体。
在 (C[a,b]) 上定义两种逐点运算:
- 加法:对任意 (f, g \in C[a,b]),定义函数 (f+g) 为
[(f+g)(x) = f(x) + g(x), \quad \forall x \in [a,b]] - 数乘:对任意 (\lambda \in \mathbb{R}),(f \in C[a,b]),定义函数 (\lambda f) 为
[(\lambda f)(x) = \lambda \cdot f(x), \quad \forall x \in [a,b]]
下面逐条验证线性空间的八条公理:
1. 加法构成阿贝尔群
(1) 交换律:
[(f+g)(x) = f(x) + g(x) = g(x) + f(x) = (g+f)(x), \quad \forall x \in [a,b]]
依据:实数加法交换律。
(2) 结合律:
[((f+g)+h)(x) = (f+g)(x) + h(x) = f(x) + g(x) + h(x) = (f+(g+h))(x)]
依据:实数加法结合律。
(3) 零元存在性:
取零函数 (0(x) = 0)(对所有 (x \in [a,b]) 取值为0),则
[(0 + f)(x) = 0(x) + f(x) = 0 + f(x) = f(x), \quad \forall x \in [a,b]]
依据:实数零元性质。
(4) 负元存在性:
对任意 (f \in C[a,b]),定义函数 (-f) 为 ((-f)(x) = -f(x)),则
[(f + (-f))(x) = f(x) + (-f(x)) = 0 = 0(x), \quad \forall x \in [a,b]]
依据:实数负元性质。
2. 数乘满足四条相容性
(1) 数乘对函数加法的分配律:
[\lambda(f+g)(x) = \lambda \cdot (f(x) + g(x)) = \lambda f(x) + \lambda g(x) = (\lambda f + \lambda g)(x)]
依据:实数乘法对加法的分配律。
(2) 数乘对实数加法的分配律:
[(\lambda + \mu)f(x) = (\lambda + \mu) \cdot f(x) = \lambda f(x) + \mu f(x) = (\lambda f + \mu f)(x)]
依据:实数乘法对加法的分配律。
(3) 数乘结合律:
[(\lambda \mu)f(x) = (\lambda \mu) \cdot f(x) = \lambda \cdot (\mu f(x)) = \lambda(\mu f)(x)]
依据:实数乘法结合律。
(4) 数乘单位元:
[1 \cdot f(x) = 1 \cdot f(x) = f(x), \quad \forall x \in [a,b]]
依据:实数乘法单位元性质。
运算封闭性补充:由连续函数的性质,两个连续函数的和仍是连续函数,实数与连续函数的乘积仍是连续函数,因此加法和数乘运算在 (C[a,b]) 中封闭。
综上,(C[a,b]) 满足线性空间的全部八条公理,因此是实数域 (\mathbb{R}) 上的线性空间。□
二、核心性质:(C[a,b]) 是无限维线性空间
定理:连续函数空间 (C[a,b]) 作为 (\mathbb{R}) 上的线性空间是无限维的。
证明:反证法。假设 (C[a,b]) 是有限维线性空间,维数为 (n)。根据有限维线性空间的基本性质,空间中任意 (n+1) 个向量必线性相关。
现在考虑 (C[a,b]) 中的 (n+1) 个函数:
[1, x, x^2, \dots, x^n]
我们来证明这组函数线性无关。
设存在实数 (a_0, a_1, \dots, a_n),使得
[a_0 \cdot 1 + a_1 \cdot x + a_2 \cdot x^2 + \dots + a_n \cdot x^n = 0(x), \quad \forall x \in [a,b]]
即多项式 (p(x) = a_0 + a_1x + \dots + a_nx^n) 在区间 ([a,b]) 上恒等于零。
根据多项式的基本性质:一个非零多项式最多有有限个根。而区间 ([a,b]) 上有无穷多个点,如果 (p(x)) 在 ([a,b]) 上恒等于零,那么它有无穷多个根,因此 (p(x)) 只能是零多项式,即
[a_0 = a_1 = a_2 = \dots = a_n = 0]
这说明函数组 ({1, x, x^2, \dots, x^n}) 线性无关,与“有限维空间中任意 (n+1) 个向量必线性相关”矛盾。因此假设不成立,(C[a,b]) 是无限维线性空间。□
深刻意义:这是我们遇到的第一个无限维线性空间,它标志着线性代数的研究对象从有限维扩展到了无限维。无限维空间与有限维空间有本质的区别,例如:
- 无限维空间中存在线性无关的无限向量组
- 无限维空间中基的存在性依赖于选择公理
- 无限维空间上的线性变换不一定有特征值
- 无限维空间中的有界闭集不一定是紧集
这些区别正是泛函分析这门学科产生的根本原因。
三、(C[a,b]) 的重要子空间
(C[a,b]) 有一系列非常重要的子空间,它们构成了分析数学的核心研究对象:
1. 多项式空间 (P[a,b])
[P[a,b] = { p(x) = a_0 + a_1x + \dots + a_nx^n \mid n \in \mathbb{N}, a_i \in \mathbb{R} }]
即所有实系数多项式的全体。
- 性质:无限维子空间,基为 ({1, x, x^2, \dots})
- 包含关系:(P[a,b] \subset C[a,b])
2. (k) 阶连续可微函数空间 (C^k[a,b])
[C^k[a,b] = { f: [a,b] \rightarrow \mathbb{R} \mid f \text{ 在 } [a,b] \text{ 上具有 } k \text{ 阶连续导数} }]
- 性质:无限维子空间
- 包含关系:(C^k[a,b] \subset C^{k-1}[a,b] \subset \dots \subset C^1[a,b] \subset C[a,b])
3. 光滑函数空间 (C^\infty[a,b])
[C^\infty[a,b] = { f: [a,b] \rightarrow \mathbb{R} \mid f \text{ 在 } [a,b] \text{ 上具有任意阶连续导数} }]
- 性质:无限维子空间
- 包含关系:(P[a,b] \subset C^\infty[a,b] \subset C^k[a,b]) 对任意 (k \in \mathbb{N}) 成立
4. 满足边界条件的函数空间
例如:
- (V_1 = { f \in C[a,b] \mid f(a) = 0 })
- (V_2 = { f \in C^1[a,b] \mid f(a) = f(b) = 0 })
这些都是线性子空间,是微分方程解空间的原型。
四、核心理论意义与后续课程衔接
(C[a,b]) 是整个分析数学中最基本的空间之一,它的重要性体现在以下几个方面:
1. 泛函分析的起点
在 (C[a,b]) 上可以定义不同的范数和内积,从而得到不同的拓扑结构:
- 一致范数:(|f|\infty = \max |f(x)|),此时 (C[a,b]) 成为巴拿赫空间
- 积分内积:(\langle f, g \rangle = \int_a^b f(x)g(x)dx),此时 (C[a,b]) 成为内积空间,其完备化就是著名的 (L^2[a,b]) 希尔伯特空间
2. 逼近论的基础
魏尔斯特拉斯逼近定理:多项式空间 (P[a,b]) 在 (C[a,b]) 中按一致范数稠密。也就是说,任何连续函数都可以用多项式一致逼近到任意精度。这个定理是数值分析、函数逼近论的基础。
3. 微分方程与积分方程的解空间
常微分方程和积分方程的解通常是连续函数或可微函数,因此它们的解空间都是 (C[a,b]) 或其子空间。线性微分方程的解空间是有限维的,而积分方程的解空间通常是无限维的。
五、常见易错点与注意事项
-
函数相等的定义:两个函数相等当且仅当它们在定义域的每一点都取相同的值,这与多项式相等的定义一致,但比多项式更一般。
-
零函数与数零的区别:(C[a,b]) 中的零元是零函数,即对所有 (x \in [a,b]),(f(x) = 0),不要与实数零混淆。
-
无限维与有限维的本质区别:不要将有限维空间的性质随意推广到无限维空间。例如,有限维空间上的线性变换一定是连续的,但无限维空间上的线性变换不一定连续。
-
子空间的验证:验证一个函数集合是子空间时,只需验证对加法和数乘封闭即可。例如,两个连续函数的和仍是连续函数,数乘连续函数仍是连续函数。
六、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| 连续函数空间 (C[a,b]) | 按逐点加法和数乘构成无限维线性空间 | 泛函分析基础;微分方程解空间;函数逼近 | 混淆函数相等与多项式相等;将有限维性质推广到无限维 |
| 无限维性证明 | 构造无限线性无关组 ({1, x, x^2, \dots}),利用多项式根的有限性 | 区分有限维与无限维空间 | 误以为所有函数空间都是无限维的(如 (F[x]_n) 是有限维) |
| 重要子空间 | (P[a,b] \subset C^\infty[a,b] \subset C^k[a,b] \subset C[a,b]) | 微分方程;积分方程;光滑分析 | 子空间包含关系搞反 |
| 与泛函分析的衔接 | 定义范数成为巴拿赫空间,定义内积完备化后成为希尔伯特空间 | 算子理论;谱理论;变分法 | 忽略拓扑结构对空间性质的影响 |
这是线性空间理论中兼具代数与分析双重意义的核心例子——全体多项式空间,它不仅是无限维线性空间的典型代表,更是连接高等代数与抽象代数的关键枢纽。下面我将为你进行严格的公理化验证,重点对比它与有限维多项式空间 (F[x]_n) 的本质区别,深入讲解其代数结构与后续课程的深刻联系。
一、严格证明:(F[x]) 是域 (F) 上的线性空间
定义:设 (F) 是任意域,定义集合
[F[x] = \left{ f(x) = a_0 + a_1x + a_2x^2 + \dots + a_nx^n \mid n \in \mathbb{N}, , a_0, a_1, \dots, a_n \in F \right}]
即域 (F) 上所有一元多项式的全体(包括零多项式,其次数规定为 (-\infty))。
在 (F[x]) 上定义两种按系数运算的操作:
- 加法:对任意 (f(x) = \sum_{i=0}^m a_i x^i),(g(x) = \sum_{i=0}^n b_i x^i),不妨设 (m \leq n),则
[f(x) + g(x) = \sum_{i=0}^n (a_i + b_i) x^i]
其中 (a_i = 0) 对 (i > m) 成立。 - 数乘:对任意 (\lambda \in F),(f(x) = \sum_{i=0}^n a_i x^i),则
[\lambda f(x) = \sum_{i=0}^n (\lambda a_i) x^i]
运算封闭性:两个多项式相加仍是多项式,数乘多项式仍是多项式,因此加法和数乘在 (F[x]) 中封闭。
八条公理验证:与有限维多项式空间 (F[x]_n) 完全一致,所有运算性质都由域 (F) 的运算性质直接导出,因此 (F[x]) 满足线性空间的全部八条公理。□
二、核心性质:(F[x]) 是无限维线性空间
定理:全体多项式空间 (F[x]) 作为域 (F) 上的线性空间是无限维的。
证明:反证法。假设 (F[x]) 是有限维线性空间,维数为 (n < \infty)。根据有限维线性空间的基本性质,空间中任意 (n+1) 个向量必线性相关。
现在考虑 (F[x]) 中的 (n+1) 个多项式:
[1, x, x^2, \dots, x^n]
我们来证明这组多项式线性无关。
设存在 (a_0, a_1, \dots, a_n \in F),使得
[a_0 \cdot 1 + a_1 \cdot x + a_2 \cdot x^2 + \dots + a_n \cdot x^n = 0(x)]
这里的 (0(x)) 是零多项式,即所有系数都为0的多项式。根据多项式相等的定义:两个多项式相等当且仅当它们的对应系数全相等,因此必须有
[a_0 = a_1 = a_2 = \dots = a_n = 0]
这说明多项式组 ({1, x, x^2, \dots, x^n}) 线性无关,与“有限维空间中任意 (n+1) 个向量必线性相关”矛盾。因此假设不成立,(F[x]) 是无限维线性空间。□
关键辨析:多项式相等 vs 多项式函数相等
- 多项式相等:形式表达式的系数对应相等,这是代数意义上的相等。
- 多项式函数相等:对定义域中所有点 (x),函数值相等,这是分析意义上的相等。
在无限域(如 (\mathbb{Q}, \mathbb{R}, \mathbb{C}))上,这两个概念是等价的;但在有限域上,不同的多项式可能诱导相同的函数。例如在二元域 (\mathbb{F}_2) 上,多项式 (x^2 + x) 和零多项式诱导相同的函数,但它们是不同的多项式。
三、(F[x]) 与 (F[x]_n) 的本质区别
| 性质 | 有限维多项式空间 (F[x]_n)(次数小于n) | 无限维多项式空间 (F[x])(全体多项式) |
|---|---|---|
| 维数 | (n)(有限维) | 无限维 |
| 标准基 | ({1, x, x^2, \dots, x^{n-1}})(有限基) | ({1, x, x^2, x^3, \dots})(可数无限基) |
| 运算封闭性 | 加法、数乘封闭;乘法不封闭(乘积次数可能≥n) | 加法、数乘、乘法都封闭(构成多项式环) |
| 元素特征 | 所有元素的次数都小于n | 元素次数可以是任意非负整数 |
| 代数结构 | 仅为线性空间 | 既是线性空间,又是主理想整环(PID) |
四、(F[x]) 的重要子空间与反例
1. 有限维子空间族
对任意正整数 (k),次数小于 (k) 的多项式空间 (F[x]_k) 都是 (F[x]) 的有限维子空间,且有严格的包含关系:
[F[x]_1 \subset F[x]_2 \subset F[x]_3 \subset \dots \subset F[x]]
这是线性空间中无限递增子空间链的典型例子。
2. 无限维子空间
- 偶多项式空间:(W_1 = { f(x) \in F[x] \mid f(-x) = f(x) }),基为 ({1, x^2, x^4, \dots})
- 奇多项式空间:(W_2 = { f(x) \in F[x] \mid f(-x) = -f(x) }),基为 ({x, x^3, x^5, \dots})
- 直和分解:在特征不为2的域上,有 (F[x] = W_1 \oplus W_2)
- 主理想子空间:对任意非零多项式 (g(x) \in F[x]),由 (g(x)) 生成的主理想
[(g(x)) = { f(x)g(x) \mid f(x) \in F[x] }]
是 (F[x]) 的无限维子空间,基为 ({g(x), xg(x), x^2g(x), \dots})
3. 经典反例
首一多项式集合不构成子空间:首一多项式是指最高次项系数为1的多项式。取首一多项式 (f(x) = x),数乘2得 (2f(x) = 2x),不是首一多项式,因此数乘不封闭,不构成子空间。
五、核心理论意义:连接高等代数与抽象代数的桥梁
(F[x]) 的根本重要性在于它同时具有线性空间和环的双重结构,是抽象代数中主理想整环(PID)的最典型例子。
1. 多项式环的代数性质
- (F[x]) 是整环:无零因子,即若 (f(x)g(x) = 0),则 (f(x) = 0) 或 (g(x) = 0)
- (F[x]) 是主理想整环:每个理想都是主理想,即存在 (g(x) \in F[x]) 使得理想 (I = (g(x)))
- (F[x]) 具有唯一分解性:每个次数≥1的多项式都可以唯一分解为不可约多项式的乘积(不计顺序和常数因子)
2. 与若尔当标准形的深刻联系
线性变换的F[x]-模观点:设 (V) 是域 (F) 上的 (n) 维线性空间,(T: V \rightarrow V) 是线性变换。我们可以将 (V) 视为 (F[x]) 上的模,定义数乘为:
[x \cdot v = T(v), \quad \forall v \in V]
根据主理想整环上有限生成模的结构定理,这个 (F[x])-模可以分解为循环模的直和,对应到线性变换就是有理标准形;如果域 (F) 是代数闭域(如 (\mathbb{C})),则进一步分解为初等因子对应的循环模,对应若尔当标准形。
这就是若尔当标准形定理的纯代数本质,它将线性变换的相似分类问题转化为模的分解问题,是代数学中结构主义思想的完美体现。
六、常见易错点与注意事项
- 混淆多项式与多项式函数:在有限域上,不同的多项式可能诱导相同的函数,但作为代数对象它们是不同的。线性无关性的证明必须基于多项式相等的定义,而不是函数相等。
- 误以为 (F[x]) 是有限维的:很多学生容易将 (F[x]) 与 (F[x]_n) 混淆,实际上 (F[x]) 包含任意高次的多项式,因此是无限维的。
- 零多项式的次数规定:零多项式的次数是 (-\infty),不是0,这一点在多项式除法、次数计算和理想生成中至关重要。
- 乘法封闭性的区别:(F[x]_n) 对乘法不封闭,而 (F[x]) 对乘法封闭,这是它们代数结构的根本区别。
七、题后总结
| 核心概念 | 关键结论 | 典型应用 | 易错点 |
|---|---|---|---|
| 全体多项式空间 (F[x]) | 按系数加法和数乘构成无限维线性空间,同时是主理想整环 | 多项式环理论;若尔当标准形的代数基础;符号计算 | 混淆多项式与多项式函数;误以为是有限维 |
| 无限维性证明 | 构造无限线性无关组 ({1, x, x^2, \dots}),利用多项式相等的定义 | 区分有限维与无限维空间 | 用函数相等代替多项式相等证明线性无关 |
| 重要子空间 | 有限维子空间族 (F[x]_k);偶/奇多项式空间;主理想 ((g(x))) | 多项式分解;模论 | 首一多项式不构成子空间 |
| 与抽象代数的衔接 | 主理想整环上有限生成模的结构定理对应若尔当标准形 | 线性变换的有理标准形;模论 | 忽略 (F[x]) 的环结构 |
这是线性空间公理化体系的第一批核心推论,所有结论都严格基于线性空间的八条公理推导得出,是整个线性代数理论大厦的基石。下面我将为你补全教材中省略的证明细节,深入讲解每个性质的逻辑本质、易错陷阱、证明方法论,以及它们在后续课程中的推广与应用。
一、整体概述
这五条性质是所有线性空间的通性,与线性空间的具体元素形式无关——无论是数组、矩阵、多项式还是连续函数,只要满足线性空间的八条公理,就必然具有这些性质。它们的证明完全不依赖任何直观,只使用公理本身,完美体现了公理化方法的威力:从最少的基本假设出发,推导出整个理论体系的所有结论。
二、逐个性质深度解析与证明补全
性质1:零元素的唯一性
准确表述:线性空间 (V) 中存在唯一的零向量 (0),使得对任意 (x \in V),都有 (0 + x = x + 0 = x)。
证明逻辑本质:这是唯一性证明的标准范式——要证明某个对象唯一,只需假设存在两个满足条件的对象,然后利用公理证明它们相等。
- 设 (0_1) 和 (0_2) 都是 (V) 的零向量
- 因为 (0_1) 是零向量,所以 (0_1 + 0_2 = 0_2)(零向量定义:对任意 (x),(0 + x = x),取 (x = 0_2))
- 因为 (0_2) 是零向量,所以 (0_1 + 0_2 = 0_1)(零向量定义:对任意 (x),(x + 0 = x),取 (x = 0_1))
- 因此 (0_1 = 0_2),零向量唯一。□
易错点:不要将线性空间的零向量与数域的零元混淆。例如:
- 在矩阵空间 (M_{m \times n}(F)) 中,零向量是零矩阵,不是数0
- 在多项式空间 (F[x]) 中,零向量是零多项式,不是数0
- 在连续函数空间 (C[a,b]) 中,零向量是零函数,不是数0
性质2:负元素的唯一性
准确表述:对任意 (x \in V),存在唯一的向量 (-x \in V),使得 (x + (-x) = (-x) + x = 0)。
证明逻辑本质:同样使用唯一性证明范式,结合加法结合律。
- 设 (y) 和 (z) 都是 (x) 的负向量,即 (x + y = 0) 且 (x + z = 0)
- 则 (y = y + 0)(零向量定义)
- (= y + (x + z))(负向量定义,(x + z = 0))
- (= (y + x) + z)(加法结合律)
- (= 0 + z)(负向量定义,(y + x = 0))
- (= z)(零向量定义)
- 因此 (y = z),负向量唯一。□
重要推论(教材未明确列出但极其常用):对任意 (x \in V),有 ((-1)x = -x)。
证明:因为 (x + (-1)x = 1 \cdot x + (-1)x = (1 + (-1))x = 0 \cdot x = 0)(数乘单位元、数乘对域加法的分配律、性质3),根据负向量的唯一性,((-1)x = -x)。□
易错点:负向量的本质是加法逆元,不是“数乘-1的结果”——虽然两者相等,但概念层次不同:负向量是加法结构的一部分,而数乘-1是数乘结构的运算。这个推论建立了两种结构之间的联系。
性质3:(\lambda x = 0) 的充要条件
准确表述:对任意 (\lambda \in F),(x \in V),(\lambda x = 0) 当且仅当 (\lambda = 0) 或 (x = 0)。
证明补全(分充分性和必要性两部分):
-
充分性(⇐):若 (\lambda = 0) 或 (x = 0),则 (\lambda x = 0)
- 先证 (0 \cdot x = 0):对任意 (\lambda \in F),有 (\lambda x = (\lambda + 0)x = \lambda x + 0x)(数乘对域加法的分配律),两边同时加上 (-\lambda x),得 (0 = 0x)。
- 再证 (\lambda \cdot 0 = 0):对任意 (x \in V),有 (\lambda x = \lambda(x + 0) = \lambda x + \lambda 0)(数乘对向量加法的分配律),两边同时加上 (-\lambda x),得 (0 = \lambda 0)。
-
必要性(⇒):若 (\lambda x = 0),则 (\lambda = 0) 或 (x = 0)
- 若 (\lambda \neq 0),则 (\lambda) 在域 (F) 中有逆元 (\lambda^{-1})
- 于是 (x = 1 \cdot x = (\lambda^{-1} \lambda)x = \lambda^{-1}(\lambda x))(数乘单位元、数乘结合律)
- (= \lambda^{-1} \cdot 0 = 0)(充分性结论)
- 因此当 (\lambda x = 0) 时,要么 (\lambda = 0),要么 (x = 0)。□
易错点:这里的“或”是逻辑或,不是“异或”——即两者可以同时成立:(0 \cdot 0 = 0)。很多学生误以为“只能有一个成立”,这是常见的逻辑错误。
深刻拓展:这个性质是域上线性空间特有的,在更一般的环上的模中不成立。例如,整数环 (\mathbb{Z}) 上的模 (\mathbb{Z}/6\mathbb{Z}) 中,(2 \cdot 3 = 0),但 (2 \neq 0) 且 (3 \neq 0)。这是域与环的本质区别之一:域中所有非零元素都有逆元,而环中不一定。
性质4:负号的运算性质
准确表述:对任意 (\lambda \in F),(x \in V),有 ((-\lambda)x = -(\lambda x) = \lambda(-x))。
证明逻辑本质:利用负向量的唯一性——要证明 (a = -b),只需证明 (a + b = 0)。
-
证明 ((-\lambda)x = -(\lambda x)):
- 因为 ((-\lambda)x + \lambda x = (-\lambda + \lambda)x = 0 \cdot x = 0)(数乘对域加法的分配律、性质3)
- 根据负向量的唯一性,((-\lambda)x = -(\lambda x))。
-
证明 (\lambda(-x) = -(\lambda x)):
- 因为 (\lambda(-x) + \lambda x = \lambda(-x + x) = \lambda \cdot 0 = 0)(数乘对向量加法的分配律、性质3)
- 根据负向量的唯一性,(\lambda(-x) = -(\lambda x))。
综上,((-\lambda)x = -(\lambda x) = \lambda(-x))。□
易错点:这里的负号有三种不同的含义:
- (-\lambda):数域 (F) 中元素 (\lambda) 的加法逆元
- (-x):线性空间 (V) 中向量 (x) 的加法逆元
- (-(\lambda x)):向量 (\lambda x) 的加法逆元
这个性质建立了这三种负号运算之间的一致性,是代数运算符号体系的基础。
性质5:分配律的有限推广
准确表述:对任意 (\lambda \in F),(x_1, x_2, \dots, x_n \in V),有
[\lambda\left(\sum_{i=1}^n x_i\right) = \sum_{i=1}^n \lambda x_i]
对任意 (\lambda_1, \lambda_2, \dots, \lambda_n \in F),(x \in V),有
[\left(\sum_{i=1}^n \lambda_i\right)x = \sum_{i=1}^n \lambda_i x]
教材省略的完整数学归纳法证明(以第一个等式为例):
- 基例(n=1):(\lambda x_1 = \lambda x_1),显然成立。
- 归纳假设:假设当 (n = k) 时等式成立,即 (\lambda\left(\sum_{i=1}^k x_i\right) = \sum_{i=1}^k \lambda x_i)。
- 归纳步骤(n=k+1):
[\lambda\left(\sum_{i=1}^{k+1} x_i\right) = \lambda\left(\sum_{i=1}^k x_i + x_{k+1}\right)]
[= \lambda\left(\sum_{i=1}^k x_i\right) + \lambda x_{k+1}](数乘对向量加法的分配律)
[= \sum_{i=1}^k \lambda x_i + \lambda x_{k+1}](归纳假设)
[= \sum_{i=1}^{k+1} \lambda x_i]
由数学归纳法,等式对所有正整数 (n) 成立。第二个等式的证明完全类似。□
重要说明:这里的和是有限和。在一般线性空间中,无限和没有定义,除非我们在线性空间上引入拓扑结构(如范数、内积),才能定义极限和收敛。这是有限维线性代数与泛函分析的重要分界线。
三、证明方法论总结
这五个性质的证明体现了线性代数中最基本的三种证明技巧:
- 唯一性证明:假设有两个满足条件的对象,利用公理证明它们相等。
- 负元证明:要证明 (a = -b),只需证明 (a + b = 0),然后利用负元的唯一性。
- 数学归纳法:将二元运算的性质推广到有限元运算。
所有证明都严格基于线性空间的八条公理,没有引入任何额外的假设或直观。这种公理化的思维方式是代数学的核心,也是后续抽象代数课程的基础。
四、常见错误与反例
-
错误1:认为“(0x = 0) 是显然的,不需要证明”
- 纠正:这是公理的推论,不是公理本身。在更一般的代数结构中,这个结论可能不成立。
-
错误2:将“或”理解为“异或”
- 纠正:(\lambda x = 0) 允许 (\lambda = 0) 且 (x = 0),这是逻辑或的基本含义。
-
错误3:将有限和的分配律推广到无限和
- 纠正:无限和需要极限概念,在纯代数的线性空间中没有定义。
-
错误4:混淆不同类型的零和负号
- 纠正:数域的零、线性空间的零向量;数的负、向量的负,是不同的概念,虽然运算性质一致。
五、后续课程衔接
- 抽象代数:这些性质在模论中大部分仍然成立,但性质3((\lambda x = 0 \iff \lambda = 0) 或 (x = 0))在一般环上的模中失效,这是域与环的本质区别。
- 泛函分析:在拓扑线性空间中,我们可以定义无限和的极限,从而将分配律推广到收敛的无限级数。
- 线性映射:线性映射的所有基本性质(如保持零向量、保持负向量、保持线性组合)的证明,都依赖于这五条基本性质。
这是线性空间结构理论的核心内容,从线性组合这一基本运算出发,层层递进地定义了线性相关性、极大无关组、秩,最终建立了基与维数的概念,完整刻画了线性空间的本质结构。下面我将为你深度解析每个概念的逻辑本质,补全教材中省略的关键证明,梳理概念间的内在联系,并指出常见的理解误区。
一、概念体系的逻辑链条
这部分内容构成了一个完美的递进式逻辑体系:
线性组合 → 线性表出 → 向量组等价 → 线性相关/无关 → 极大无关组 → 秩 → 基 → 维数
每一个概念都建立在前一个概念的基础之上,最终指向线性空间的核心不变量——维数。
二、核心概念深度解析
1. 线性组合与线性表出
定义本质:线性组合是线性空间中唯一允许的运算方式——有限次加法和数乘的组合。
- 关键细节(教材强调但极易忽略):无限向量组的线性组合只能是其中有限个向量的线性组合。这是纯代数线性空间的本质特征:没有极限概念,无限和没有定义。
- 几何意义:在 (\mathbb{R}^3) 中,两个向量的线性组合张成一个平面(或直线),三个不共面向量的线性组合张成整个空间。
向量组等价:两个向量组可以互相线性表出。
- 基本性质:等价关系具有自反性、对称性、传递性。
- 传递性证明:若 (S_2) 可由 (S_1) 表出,(S_3) 可由 (S_2) 表出,则 (S_3) 中任意向量可表为 (S_2) 中向量的线性组合,而每个 (S_2) 中的向量又可表为 (S_1) 中向量的线性组合,代入后即得 (S_3) 中向量可表为 (S_1) 中向量的线性组合。
2. 线性相关与线性无关
这是整个线性代数最核心的概念,没有之一。
| 概念 | 严格定义 | 等价表述 | 几何意义((\mathbb{R}^3)) |
|---|---|---|---|
| 线性相关 | 存在不全为零的 (\lambda_1, \dots, \lambda_r \in F),使得 (\sum_{i=1}^r \lambda_i \alpha_i = 0) | 至少有一个向量可以表示为其余向量的线性组合 | 1个向量:零向量 2个向量:共线 3个向量:共面 |
| 线性无关 | 若 (\sum_{i=1}^r \lambda_i \alpha_i = 0),则必有 (\lambda_1 = \dots = \lambda_r = 0) | 没有任何一个向量可以表示为其余向量的线性组合 | 1个向量:非零向量 2个向量:不共线 3个向量:不共面 |
关键辨析:
- “不全为零”≠“全不为零”:只要有一个系数非零即可,允许部分系数为零。
- 线性相关性是向量组的整体性质,不是单个向量的性质。
- 包含零向量的向量组一定线性相关(取零向量的系数为1,其余为0)。
3. 极大无关组与秩
极大无关组的两个等价定义:
- 向量组 (S) 的子集 (S_M) 满足:① (S_M) 线性无关;② (S) 中任意向量都可由 (S_M) 线性表出。
- 向量组 (S) 的子集 (S_M) 满足:① (S_M) 线性无关;② 任何真包含 (S_M) 的子集都线性相关。
核心性质:
- 极大无关组不唯一,但不同极大无关组所含向量的个数唯一,这个唯一的数称为向量组的秩。
- 等价的向量组有相同的秩。
4. 基与维数
基的两个等价定义:
- 线性空间 (V) 的极大线性无关组称为 (V) 的一组基。
- 线性空间 (V) 的子集 (B) 满足:① (B) 线性无关;② (V) 中任意向量都可由 (B) 线性表出。
维数:基中向量的个数称为线性空间 (V) 的维数,记作 (\dim V)。
- 若 (V) 有有限基,则称 (V) 为有限维线性空间;否则称为无限维线性空间。
- 零空间 ({0}) 的维数规定为0。
三、教材省略的核心定理证明
定理1(Steinitz替换引理推论)
若向量组 (\alpha_1, \dots, \alpha_r) 线性无关,且可由向量组 (\beta_1, \dots, \beta_s) 线性表出,则 (r \leq s)。
证明:反证法。假设 (r > s)。
因为 (\alpha_1, \dots, \alpha_r) 可由 (\beta_1, \dots, \beta_s) 线性表出,所以存在 (s \times r) 矩阵 (A),使得
[(\alpha_1, \dots, \alpha_r) = (\beta_1, \dots, \beta_s)A]
考虑齐次线性方程组 (Ax = 0),它有 (r) 个未知数,(s) 个方程,且 (r > s),因此必有非零解 (x = (k_1, \dots, k_r)^T \neq 0)。
于是
[\sum_{i=1}^r k_i \alpha_i = (\alpha_1, \dots, \alpha_r)x = (\beta_1, \dots, \beta_s)Ax = (\beta_1, \dots, \beta_s)0 = 0]
这与 (\alpha_1, \dots, \alpha_r) 线性无关矛盾。因此假设不成立,(r \leq s)。□
定理2(维数的不变性)
有限维线性空间的任意两组基所含向量的个数相等。
证明:设 (B_1 = {\alpha_1, \dots, \alpha_n}) 和 (B_2 = {\beta_1, \dots, \beta_m}) 是线性空间 (V) 的两组基。
- 因为 (B_1) 是基,所以 (B_2) 可由 (B_1) 线性表出,又 (B_2) 线性无关,由定理1得 (m \leq n)。
- 因为 (B_2) 是基,所以 (B_1) 可由 (B_2) 线性表出,又 (B_1) 线性无关,由定理1得 (n \leq m)。
因此 (n = m),维数唯一。□
四、常见理解误区与易错点
-
误区1:认为无限向量组的线性组合可以是无限个向量的和
- 纠正:纯代数线性空间中没有极限概念,无限和没有定义。所有线性组合都是有限的。
-
误区2:认为“线性相关就是有一个向量是其余向量的线性组合”对单个向量也成立
- 纠正:单个向量线性相关当且仅当它是零向量,这是定义的特例。
-
误区3:认为极大无关组是唯一的
- 纠正:极大无关组不唯一,但秩是唯一的。例如 (\mathbb{R}^2) 中,({(1,0), (0,1)}) 和 ({(1,1), (1,0)}) 都是基。
-
误区4:认为所有线性空间都有基是显然的
- 纠正:无限维线性空间基的存在性依赖于选择公理,这是集合论中的一个基本公理,不是显然成立的。
-
误区5:认为线性相关性与基域无关
- 纠正:线性相关性依赖于基域。例如,复数 (1) 和 (i) 在实数域上线性无关,但在复数域上线性相关((i \cdot 1 + (-1) \cdot i = 0))。
五、核心理论意义
这部分内容是整个线性代数的理论基石,其核心成果是:
有限维线性空间的维数是唯一的同构不变量。
也就是说,域 (F) 上任意两个 (n) 维线性空间都是同构的,它们都同构于 (n) 元数组空间 (F^n)。这一结论的意义在于:
- 它将所有有限维线性空间的研究统一到了 (F^n) 的研究上。
- 它为线性变换的矩阵表示奠定了基础:线性变换可以用矩阵来表示,线性变换的运算对应矩阵的运算。
- 它建立了线性空间的“大小”概念,维数是线性空间最基本的不变量。
六、典型例子回顾
| 线性空间 | 基 | 维数 |
|---|---|---|
| (n) 元数组空间 (F^n) | (\varepsilon_1, \dots, \varepsilon_n)(标准基) | (n) |
| (m \times n) 矩阵空间 (M_{m \times n}(F)) | (E_{ij})(矩阵单位) | (mn) |
| 次数小于 (n) 的多项式空间 (F[x]_n) | (1, x, x^2, \dots, x^{n-1}) | (n) |
| 全体多项式空间 (F[x]) | (1, x, x^2, x^3, \dots) | 无限维 |
| 连续函数空间 (C[a,b]) | 不存在可数基 | 无限维 |
这是有限维线性空间中基的两个核心判定引理,是整个线性代数中最常用的工具之一。它极大地简化了基的验证过程——在已知空间维数为n的前提下,我们不再需要同时验证"线性无关"和"生成整个空间"两个条件,只需验证其中一个即可。下面我将为你补全证明的逻辑细节,深入讲解其几何意义、适用边界,并通过典型例题展示其应用。
一、引理整体概述
引理5.1 是有限维线性空间特有的性质,它揭示了维数、线性无关性和生成性三者之间的深刻联系:
在n维线性空间V中:
- 任意n个线性无关的向量,自动生成整个空间,因此构成基
- 任意n个能生成整个空间的向量,自动线性无关,因此构成基
这两个结论是双向互补的,它们将基的判定条件从"两个都要满足"简化为"满足一个即可",是证明一组向量是基的首选方法。
二、引理(1)深度解析与证明补全
准确表述:设V是n维线性空间,若α₁, α₂, …, αₙ ∈ V线性无关,则{α₁, α₂, …, αₙ}是V的一组基。
证明逻辑链拆解
- 核心前提:V是n维线性空间,意味着V中存在一组基,且任意n+1个向量必线性相关(这是维数定义和Steinitz替换引理的直接推论)。
- 任取向量:对任意α ∈ V,考虑向量组{α₁, α₂, …, αₙ, α},它包含n+1个向量,因此必线性相关。
- 存在非零组合:存在不全为零的数λ₁, λ₂, …, λₙ, λ ∈ F,使得
[\lambda_1\alpha_1 + \lambda_2\alpha_2 + \dots + \lambda_n\alpha_n + \lambda\alpha = 0] - 关键反证:若λ=0,则上式变为
[\lambda_1\alpha_1 + \lambda_2\alpha_2 + \dots + \lambda_n\alpha_n = 0]
且λ₁, …, λₙ不全为零,这与{α₁, …, αₙ}线性无关矛盾。因此λ≠0。 - 线性表出:由λ≠0,可解出
[\alpha = -\frac{\lambda_1}{\lambda}\alpha_1 - \frac{\lambda_2}{\lambda}\alpha_2 - \dots - \frac{\lambda_n}{\lambda}\alpha_n]
即α可由{α₁, …, αₙ}线性表出。 - 结论:{α₁, …, αₙ}线性无关且生成V,因此是V的一组基。□
几何直观(以R³为例)
- 在三维空间R³中,任意3个不共面的向量(线性无关),一定能张成整个空间。
- 这是我们在解析几何中熟知的结论:空间中任意一点都可以表示为3个不共面向量的线性组合。
三、引理(2)深度解析与证明补全
准确表述:设V是n维线性空间,若V可由α₁, α₂, …, αₙ线性表出,则{α₁, α₂, …, αₙ}是V的一组基。
证明逻辑链拆解
- 取极大无关组:设向量组{α₁, …, αₙ}的一个极大线性无关组为{αᵢ₁, αᵢ₂, …, αᵢᵣ}。
- 等价性:根据极大无关组的定义,{α₁, …, αₙ}与{αᵢ₁, …, αᵢᵣ}等价,因此它们生成相同的空间。
- 生成V:因为{α₁, …, αₙ}生成V,所以{αᵢ₁, …, αᵢᵣ}也生成V。
- 基的定义:{αᵢ₁, …, αᵢᵣ}线性无关且生成V,因此是V的一组基。
- 维数相等:V的维数是n,而基中向量的个数就是维数,因此r=n。
- 结论:极大无关组包含了原向量组的所有n个向量,说明{α₁, …, αₙ}本身线性无关,因此是V的一组基。□
几何直观(以R³为例)
- 在三维空间R³中,任意3个能张成整个空间的向量,一定不共面(线性无关)。
- 反过来说,如果3个向量共面,它们只能张成一个平面,不可能张成整个三维空间。
四、关键适用边界:仅适用于有限维空间
极其重要:这两个引理只在有限维线性空间中成立,在无限维空间中完全不成立。下面给出两个经典反例:
反例1:线性无关但不生成空间
考虑全体多项式空间F[x](无限维),取向量组
[S_1 = {x, x^2, x^3, \dots}]
- 线性无关:若存在有限个系数k₁, …, kₙ使得k₁x + k₂x² + … + kₙxⁿ = 0,则所有系数必为零。
- 不生成空间:常数多项式1不能由S₁线性表出(S₁中所有多项式的常数项都是0)。
- 结论:S₁是无限维空间中的线性无关组,但不是基。
反例2:生成空间但线性相关
考虑全体多项式空间F[x],取向量组
[S_2 = {1, 1+x, 1+x+x^2, 1+x+x2+x3, \dots}]
- 生成空间:任意多项式都可以表示为S₂中元素的线性组合。例如:
[x = (1+x) - 1, \quad x^2 = (1+x+x^2) - (1+x), \quad \dots] - 线性相关:显然(1+x) - 1 = x ≠ 0,说明S₂中存在非零线性组合等于零向量。
- 结论:S₂是无限维空间中的生成组,但不是基。
五、典型应用场景与例题
引理5.1是证明一组向量是基的首选方法,比直接验证两个条件要高效得多。
例题1:证明R³中的向量组是基
证明向量组α₁=(1,1,1), α₂=(1,1,0), α₃=(1,0,0)是R³的一组基。
证明:R³的维数是3,我们只需验证这3个向量线性无关。
设k₁α₁ + k₂α₂ + k₃α₃ = 0,即
[
\begin{cases}
k_1 + k_2 + k_3 = 0 \
k_1 + k_2 = 0 \
k_1 = 0
\end{cases}
]
解得k₁=k₂=k₃=0,因此α₁, α₂, α₃线性无关。
根据引理5.1(1),它们构成R³的一组基。□
例题2:利用生成性证明基
设α₁, α₂, α₃是R³的一组基,证明β₁=α₁+α₂, β₂=α₂+α₃, β₃=α₃+α₁也是R³的一组基。
证明:R³的维数是3,我们只需证明R³可由β₁, β₂, β₃线性表出。
由已知:
[
\begin{cases}
\beta_1 = \alpha_1 + \alpha_2 \
\beta_2 = \alpha_2 + \alpha_3 \
\beta_3 = \alpha_3 + \alpha_1
\end{cases}
]
解这个方程组,得:
[
\begin{cases}
\alpha_1 = \frac{1}{2}(\beta_1 - \beta_2 + \beta_3) \
\alpha_2 = \frac{1}{2}(\beta_1 + \beta_2 - \beta_3) \
\alpha_3 = \frac{1}{2}(-\beta_1 + \beta_2 + \beta_3)
\end{cases}
]
因为α₁, α₂, α₃生成R³,所以β₁, β₂, β₃也生成R³。
根据引理5.1(2),它们构成R³的一组基。□
六、常见易错点总结
- 忽略维数条件:必须已知空间的维数是n,才能应用这两个引理。如果不知道维数,还是要同时验证线性无关性和生成性。
- 推广到无限维:如前所述,这两个引理在无限维空间中不成立,千万不要随意推广。
- 向量个数必须等于维数:如果向量个数不等于n,引理不适用。例如,n维空间中n-1个线性无关的向量不能生成空间,n+1个生成空间的向量一定线性相关。
- 基的唯一性:引理只说明满足条件的向量组是基,但基不是唯一的。n维空间有无穷多组基。
七、后续课程衔接
- 矩阵理论:n阶方阵可逆当且仅当它的列向量组线性无关,当且仅当它的列向量组生成Rⁿ,这正是引理5.1的直接应用。
- 线性变换:线性变换在不同基下的矩阵相似,而基的选择正是基于引理5.1。
- 坐标变换:从一组基到另一组基的过渡矩阵可逆,其证明也依赖于引理5.1。
这是线性代数中最具实用价值的定义之一,它建立了抽象向量与具体数组之间的一一对应关系,是连接抽象线性空间理论与具体矩阵计算的桥梁。下面我将为你补全教材省略的坐标唯一性证明,深入讲解有序基的本质、坐标映射的同构性质,并通过不同线性空间的例子直观展示坐标的含义。
一、定义核心解读
定义5.5 包含三个层次的关键信息:
- 坐标的存在性:因为 (\alpha_1, \dots, \alpha_n) 是 (V) 的基,所以任意 (\alpha \in V) 都可以表示为基向量的线性组合。
- 坐标的唯一性:给定一组有序基后,每个向量的坐标是唯一的(教材仅说“显然”,下面给出严格证明)。
- 有序基的概念:基不是单纯的向量集合,而是按顺序排列的向量组,基的顺序改变会导致坐标分量的顺序改变。
二、坐标唯一性的严格证明
定理:设 (\alpha_1, \dots, \alpha_n) 是线性空间 (V) 的一组有序基,则对任意 (\alpha \in V),存在唯一的一组数 (a_1, \dots, a_n \in F),使得
[\alpha = a_1\alpha_1 + a_2\alpha_2 + \dots + a_n\alpha_n]
证明:
- 存在性:由基的定义,基可以线性表出整个空间,因此存在性显然。
- 唯一性:假设 (\alpha) 有两种不同的表示:
[\alpha = a_1\alpha_1 + \dots + a_n\alpha_n = b_1\alpha_1 + \dots + b_n\alpha_n]
两式相减,得
[(a_1 - b_1)\alpha_1 + (a_2 - b_2)\alpha_2 + \dots + (a_n - b_n)\alpha_n = 0]
因为 (\alpha_1, \dots, \alpha_n) 是基,所以它们线性无关。根据线性无关的定义,所有系数必须为零:
[a_1 - b_1 = 0, \quad a_2 - b_2 = 0, \quad \dots, \quad a_n - b_n = 0]
即 (a_i = b_i) 对所有 (i=1, \dots, n) 成立。因此坐标唯一。□
三、有序基的本质:为什么“顺序”至关重要
很多学生容易忽略“有序”二字,误以为基只是一个向量集合。实际上,基的顺序是坐标定义的必要前提,没有顺序就没有坐标。
直观例子
在二维实空间 (\mathbb{R}^2) 中:
- 取有序基 (B_1 = {\varepsilon_1, \varepsilon_2} = {(1,0), (0,1)}),向量 (\alpha = (1,2)) 的坐标是 ((1,2))。
- 取有序基 (B_2 = {\varepsilon_2, \varepsilon_1} = {(0,1), (1,0)}),向量 (\alpha = (1,2)) 的坐标是 ((2,1))。
同一个向量,在顺序不同的基下,坐标完全不同。这说明坐标是相对于有序基而言的,脱离了基的顺序,坐标没有意义。
四、不同线性空间中的坐标示例
坐标的概念适用于所有有限维线性空间,不仅仅是数组空间。下面给出三个典型例子:
1. 矩阵空间 (M_{2 \times 2}(F))
- 标准有序基:(B = {E_{11}, E_{12}, E_{21}, E_{22}}),其中
[E_{11} = \begin{pmatrix}1 & 0 \ 0 & 0\end{pmatrix}, \quad E_{12} = \begin{pmatrix}0 & 1 \ 0 & 0\end{pmatrix}, \quad E_{21} = \begin{pmatrix}0 & 0 \ 1 & 0\end{pmatrix}, \quad E_{22} = \begin{pmatrix}0 & 0 \ 0 & 1\end{pmatrix}] - 任意矩阵 (A = \begin{pmatrix}a & b \ c & d\end{pmatrix}) 在基 (B) 下的坐标为:
[(a, b, c, d)^T]
2. 多项式空间 (F[x]_3)(次数小于3的多项式)
- 标准有序基:(B = {1, x, x^2})
- 任意多项式 (f(x) = 2 + 3x - 5x^2) 在基 (B) 下的坐标为:
[(2, 3, -5)^T]
3. 复数空间 (\mathbb{C}) 作为 (\mathbb{R}) 上的线性空间
- 标准有序基:(B = {1, i})
- 任意复数 (z = 3 + 4i) 在基 (B) 下的坐标为:
[(3, 4)^T]
五、坐标映射的同构性质
坐标的定义本质上是建立了一个从抽象线性空间 (V) 到具体数组空间 (F^n) 的映射,这个映射是线性同构。
定义(坐标映射):设 (B = {\alpha_1, \dots, \alpha_n}) 是 (V) 的一组有序基,定义映射
[\varphi_B: V \rightarrow F^n, \quad \varphi_B(\alpha) = (a_1, a_2, \dots, a_n)^T]
其中 (\alpha = a_1\alpha_1 + \dots + a_n\alpha_n) 是 (\alpha) 在基 (B) 下的坐标。
定理:坐标映射 (\varphi_B) 是线性同构,即:
- 线性性:对任意 (\alpha, \beta \in V),(\lambda \in F),有
[\varphi_B(\alpha + \beta) = \varphi_B(\alpha) + \varphi_B(\beta), \quad \varphi_B(\lambda \alpha) = \lambda \varphi_B(\alpha)] - 双射性:(\varphi_B) 既是单射又是满射。
证明:
- 线性性:设 (\alpha = \sum a_i\alpha_i),(\beta = \sum b_i\alpha_i),则
[\alpha + \beta = \sum (a_i + b_i)\alpha_i \implies \varphi_B(\alpha + \beta) = (a_1 + b_1, \dots, a_n + b_n)^T = \varphi_B(\alpha) + \varphi_B(\beta)]
[\lambda \alpha = \sum (\lambda a_i)\alpha_i \implies \varphi_B(\lambda \alpha) = (\lambda a_1, \dots, \lambda a_n)^T = \lambda \varphi_B(\alpha)] - 单射性:若 (\varphi_B(\alpha) = \varphi_B(\beta)),则 (\alpha) 和 (\beta) 有相同的坐标,由坐标唯一性得 (\alpha = \beta)。
- 满射性:对任意 ((a_1, \dots, a_n)^T \in F^n),令 (\alpha = \sum a_i\alpha_i),则 (\varphi_B(\alpha) = (a_1, \dots, a_n)^T)。
因此 (\varphi_B) 是线性同构,(V \cong F^n)。□
深刻意义:这个定理是线性代数的核心定理之一,它告诉我们:
所有n维线性空间在代数结构上是完全相同的,它们都同构于n元数组空间 (F^n)。
这就是为什么我们可以用矩阵和数组来研究所有有限维线性空间中的问题。
六、行坐标与列坐标的选择
教材提到了行坐标和列坐标的区别,在实际应用中,我们几乎总是使用列坐标,原因如下:
- 线性变换的作用可以表示为矩阵乘列向量:若线性变换 (T) 在基 (B) 下的矩阵为 (A),则
[\varphi_B(T(\alpha)) = A \cdot \varphi_B(\alpha)]
形式简洁,符合我们的书写习惯。 - 如果使用行坐标,则线性变换的作用需要表示为行向量乘矩阵的转置:
[\varphi_B(T(\alpha)) = \varphi_B(\alpha) \cdot A^T]
形式更复杂,容易出错。
七、常见易错点总结
- 忽略基的有序性:基是有序向量组,不是集合,顺序改变会导致坐标改变。
- 混淆向量与坐标:向量是抽象的,坐标是具体的数组,同一个向量在不同基下有不同的坐标。
- 误以为坐标是向量的固有属性:坐标依赖于基的选择,没有基就没有坐标。
- 零向量的坐标:零向量在任何基下的坐标都是零向量,这是唯一的例外。
八、后续课程衔接
坐标的定义是后续所有内容的基础:
- 坐标变换:同一个向量在不同基下的坐标之间的关系,由过渡矩阵联系。
- 线性变换的矩阵表示:线性变换在一组基下的矩阵,本质上是基向量的像在该基下的坐标构成的矩阵。
- 欧氏空间的内积:内积可以用向量在标准正交基下的坐标表示为点积。
这是线性空间基与维数的经典原型汇总,系统地展示了我们之前讨论过的所有核心线性空间的标准基与维数。这些例子是整个线性代数理论的"原型库",所有有限维线性空间都同构于其中的 (F^n),而无限维例子则揭示了线性空间理论的广阔边界。下面我将为你逐个深入解析每个例子的细节,补充教材省略的关键说明,并通过对比表格清晰呈现所有结论。
一、整体概述
例5.7将线性空间分为三大类:
- 数组型:(F^n)(有限维,标准模型)
- 矩阵型:(M_{m \times n}(F))(有限维,线性变换的载体)
- 函数/域扩张型:(\mathbb{C}/\mathbb{R})、(\mathbb{Q}(\sqrt{2})/\mathbb{Q})、(\mathbb{R}/\mathbb{Q})、(F[x])(包含有限维和无限维,连接代数与分析)
每个例子都明确给出了标准基和维数,这是后续所有计算和证明的基础。
二、逐个例子深度解析
1. n元数组空间 (F^n)
- 标准基(自然基):(\varepsilon_1 = (1,0,\dots,0), \varepsilon_2 = (0,1,\dots,0), \dots, \varepsilon_n = (0,0,\dots,1))
- 维数:(\dim F^n = n)
- 核心特点:向量本身就是它在自然基下的坐标。例如,向量 (\alpha = (a_1,a_2,\dots,a_n)) 在自然基下的坐标就是 ((a_1,a_2,\dots,a_n)),这也是"自然基"名称的由来。
- 补充说明:列向量空间 (F^{(n)}) 与行向量空间 (F^n) 同构,自然基为标准单位列向量。在实际应用中,我们通常使用列向量,因为线性变换的作用可以表示为矩阵乘列向量。
2. (m \times n) 矩阵空间 (M_{m \times n}(F))
- 标准基(矩阵单位组):({ E_{ij} \mid 1 \leq i \leq m, 1 \leq j \leq n }),其中 (E_{ij}) 是第 (i) 行第 (j) 列元素为1,其余元素为0的矩阵。
- 维数:(\dim M_{m \times n}(F) = mn)
- 关键细节(教材未强调):作为有序基,矩阵单位必须规定顺序,通常采用行优先顺序:
[E_{11}, E_{12}, \dots, E_{1n}, E_{21}, E_{22}, \dots, E_{2n}, \dots, E_{m1}, E_{m2}, \dots, E_{mn}] - 坐标示例:2×2矩阵 (A = \begin{pmatrix} a & b \ c & d \end{pmatrix}) 在有序基 ({E_{11}, E_{12}, E_{21}, E_{22}}) 下的坐标为 ((a, b, c, d)^T)。
- 易错点:很多学生容易将维数误算为 (m + n),实际上每个矩阵单位都是独立的基向量,总共有 (m \times n) 个。
3. 域扩张作为线性空间
这组例子最深刻地体现了基域对线性空间结构的决定性影响——同一个集合在不同基域上可以是完全不同的线性空间,维数也会发生根本性变化。
(1) 复数域 (\mathbb{C})
- 作为实数域 (\mathbb{R}) 上的线性空间:
- 标准基:({1, i})
- 维数:(\dim_{\mathbb{R}} \mathbb{C} = 2)
- 坐标示例:复数 (z = 3 + 4i) 的坐标为 ((3, 4)^T)
- 作为复数域 (\mathbb{C}) 上的线性空间:
- 基:任意非零复数(如 ({1}, {2}, {i}) 都是基)
- 维数:(\dim_{\mathbb{C}} \mathbb{C} = 1)
- 坐标示例:复数 (z = 3 + 4i) 在基 ({1}) 下的坐标就是 (3 + 4i)
(2) 二次扩域 (\mathbb{Q}(\sqrt{2}))
- 基域:有理数域 (\mathbb{Q})
- 标准基:({1, \sqrt{2}})
- 维数:(\dim_{\mathbb{Q}} \mathbb{Q}(\sqrt{2}) = 2)
- 线性无关性证明:若存在有理数 (a, b) 使得 (a + b\sqrt{2} = 0),则若 (b \neq 0),有 (\sqrt{2} = -a/b \in \mathbb{Q}),与 (\sqrt{2}) 是无理数矛盾,故 (b = 0),从而 (a = 0)。
(3) 实数域 (\mathbb{R}) 作为有理数域 (\mathbb{Q}) 上的线性空间
- 维数:无限维
- 证明思路:取超越数 (\pi),则向量组 ({1, \pi, \pi^2, \pi^3, \dots}) 线性无关。因为若存在非零有理系数多项式 (f(x)) 使得 (f(\pi) = 0),则 (\pi) 是代数数,与超越数定义矛盾。
- 重要说明:这个空间的基(称为Hamel基)是不可数的,其存在性依赖于选择公理,无法具体构造出来。
(4) 全体多项式空间 (F[x])
- 标准基:({1, x, x^2, x^3, \dots})
- 维数:无限维
- 与有限维多项式空间的对比:
- (F[x]_n)(次数小于n的多项式):有限维,维数n,基为 ({1, x, \dots, x^{n-1}})
- (F[x])(全体多项式):无限维,包含任意高次的多项式
三、所有例子汇总对比表
| 线性空间 | 基域 | 标准基 | 维数 | 类型 |
|---|---|---|---|---|
| n元行向量空间 (F^n) | (F) | (\varepsilon_1, \dots, \varepsilon_n) | (n) | 有限维数组型 |
| n元列向量空间 (F^{(n)}) | (F) | (\varepsilon_1^T, \dots, \varepsilon_n^T) | (n) | 有限维数组型 |
| (m \times n) 矩阵空间 (M_{m \times n}(F)) | (F) | (E_{ij})(1≤i≤m,1≤j≤n) | (mn) | 有限维矩阵型 |
| 复数域 (\mathbb{C}) | (\mathbb{R}) | ({1, i}) | 2 | 有限维域扩张型 |
| 复数域 (\mathbb{C}) | (\mathbb{C}) | 任意非零复数 | 1 | 有限维域扩张型 |
| 二次扩域 (\mathbb{Q}(\sqrt{2})) | (\mathbb{Q}) | ({1, \sqrt{2}}) | 2 | 有限维域扩张型 |
| 实数域 (\mathbb{R}) | (\mathbb{Q}) | Hamel基(不可数) | 无限维 | 无限维域扩张型 |
| 全体多项式空间 (F[x]) | (F) | ({1, x, x^2, \dots}) | 无限维 | 无限维函数型 |
四、核心结论与易错点总结
- 基域是线性空间不可分割的一部分:同一个集合在不同基域上的维数可以完全不同,这是线性空间最容易被忽略的本质特征。
- 基不唯一,但维数唯一:每个线性空间都有无穷多组基,但所有基所含向量的个数(维数)是唯一的不变量。
- 有限维与无限维的本质区别:有限维空间有有限基,无限维空间没有有限基。无限维空间的性质与有限维空间有很大差异,很多有限维的结论不能推广到无限维。
- 标准基的便利性:标准基通常是最简单、最常用的基,但在很多问题中,选择合适的非标准基可以大大简化计算(如对称矩阵空间的基、傅里叶基等)。
五、理论意义与后续应用
这些例子构成了线性代数所有应用的基础:
- (F^n) 是所有有限维线性空间的标准模型,所有有限维问题都可以转化为数组问题。
- (M_{m \times n}(F)) 是线性变换的矩阵表示的载体,线性变换的运算对应矩阵的运算。
- 域扩张作为线性空间是代数数论的基础,域扩张的次数是代数数论中最基本的不变量。
- 多项式空间 (F[x]) 是函数逼近论、符号计算的基础,也是抽象代数中多项式环理论的研究对象。
这是线性空间结构理论的核心内容之一,它引入了子空间的概念,为我们研究线性空间的内部结构提供了基本工具。生成子空间则是构造子空间的最基本方法,它将向量组的线性相关性与子空间的维数紧密联系起来。下面我将为你补全教材省略的核心判定定理,深入讲解子空间的本质、生成子空间的性质,并通过典型例子和反例帮助你掌握这一概念。
一、子空间的定义与核心判定定理
1. 定义解读
定义5.6 指出:线性空间 (V) 的非空子集 (W) 若在 (V) 原有的加法和数乘运算下仍构成线性空间,则称 (W) 是 (V) 的子空间。
关键细节:子空间的运算必须与原空间完全一致,不能重新定义运算。如果在子集上定义了不同的加法或数乘,即使构成线性空间,也不是原空间的子空间。
2. 简化判定定理(教材省略,最常用)
定理:设 (W) 是线性空间 (V) 的非空子集,则 (W) 是 (V) 的子空间当且仅当 (W) 对 (V) 中的加法和数乘运算封闭,即:
- 对任意 (\alpha, \beta \in W),有 (\alpha + \beta \in W)(加法封闭)
- 对任意 (\lambda \in F),(\alpha \in W),有 (\lambda \alpha \in W)(数乘封闭)
证明:
- 必要性:若 (W) 是子空间,则它本身是线性空间,自然对加法和数乘封闭。
- 充分性:若 (W) 对加法和数乘封闭,则只需验证线性空间八条公理中不显然成立的部分:
- 零元存在性:因为 (W) 非空,取 (\alpha \in W),由数乘封闭性,(0 \cdot \alpha = 0 \in W)。
- 负元存在性:对任意 (\alpha \in W),由数乘封闭性,((-1) \cdot \alpha = -\alpha \in W)。
- 其余六条公理(交换律、结合律、分配律等)在 (V) 中成立,自然在子集 (W) 中也成立。
因此 (W) 满足线性空间的全部八条公理,是 (V) 的子空间。□
推论:子空间必包含原空间的零向量。这是判断一个集合不是子空间的快速方法——如果一个集合不包含零向量,它一定不是子空间。
二、平凡子空间与真子空间
- 平凡子空间:任何线性空间 (V) 都有两个天然的子空间:
- 零子空间:({0}),仅包含零向量
- 全空间:(V) 本身
- 真子空间:除了平凡子空间之外的子空间称为真子空间。
几何直观:在三维空间 (\mathbb{R}^3) 中:
- 零子空间对应原点
- 一维真子空间对应过原点的直线
- 二维真子空间对应过原点的平面
- 全空间对应整个三维空间
注意:不过原点的直线或平面不是 (\mathbb{R}^3) 的子空间,因为它们不包含零向量。
三、生成子空间(张成子空间)
生成子空间是构造子空间的最基本方法,它告诉我们如何从任意一个向量集合出发,构造出包含它的最小子空间。
1. 定义
设 (S) 是线性空间 (V) 的任意非空子集,由 (S) 中所有有限个向量的线性组合构成的集合,称为由 (S) 生成(或张成)的子空间,记作 (\operatorname{span}(S)),即:
[\operatorname{span}(S) = \left{ \sum_{i=1}^k \lambda_i \alpha_i \mid k \in \mathbb{N}^+, \lambda_i \in F, \alpha_i \in S \right}]
当 (S = {\alpha_1, \alpha_2, \dots, \alpha_s}) 是有限集时,记为:
[\operatorname{span}{\alpha_1, \alpha_2, \dots, \alpha_s} = \left{ \sum_{i=1}^s \lambda_i \alpha_i \mid \lambda_i \in F \right}]
2. 核心性质
定理:(\operatorname{span}(S)) 是包含 (S) 的 (V) 的最小子空间,即:
- (S \subseteq \operatorname{span}(S))
- 若 (W) 是 (V) 的子空间且 (S \subseteq W),则 (\operatorname{span}(S) \subseteq W)
证明:
- 对任意 (\alpha \in S),(\alpha = 1 \cdot \alpha) 是 (S) 中一个向量的线性组合,故 (\alpha \in \operatorname{span}(S)),因此 (S \subseteq \operatorname{span}(S))。
- 若 (W) 是子空间且 (S \subseteq W),则 (W) 对线性组合封闭,因此 (S) 中任意有限个向量的线性组合都属于 (W),即 (\operatorname{span}(S) \subseteq W)。□
3. 有限生成子空间的维数与基
定理:设 (S = {\alpha_1, \alpha_2, \dots, \alpha_s}) 是有限向量组,则:
- (\dim \operatorname{span}{\alpha_1, \dots, \alpha_s} = \operatorname{rank}{\alpha_1, \dots, \alpha_s})(生成子空间的维数等于向量组的秩)
- 向量组 ({\alpha_1, \dots, \alpha_s}) 的任意一个极大线性无关组都是 (\operatorname{span}{\alpha_1, \dots, \alpha_s}) 的一组基。
证明:设 ({\alpha_{i_1}, \dots, \alpha_{i_r}}) 是 ({\alpha_1, \dots, \alpha_s}) 的一个极大无关组,则:
- 它线性无关。
- ({\alpha_1, \dots, \alpha_s}) 中每个向量都可由它线性表出,因此 (\operatorname{span}{\alpha_1, \dots, \alpha_s}) 中每个向量都可由它线性表出。
根据基的定义,({\alpha_{i_1}, \dots, \alpha_{i_r}}) 是 (\operatorname{span}{\alpha_1, \dots, \alpha_s}) 的一组基,维数为 (r = \operatorname{rank}{\alpha_1, \dots, \alpha_s})。□
4. 生成子空间相等的条件
定理:两个向量组生成相同的子空间当且仅当这两个向量组等价(可以互相线性表出)。
证明:
- 若 (\operatorname{span}{\alpha_1, \dots, \alpha_s} = \operatorname{span}{\beta_1, \dots, \beta_t}),则每个 (\alpha_i) 都属于右边的生成子空间,故可由 (\beta_1, \dots, \beta_t) 线性表出;同理每个 (\beta_j) 可由 (\alpha_1, \dots, \alpha_s) 线性表出,因此两向量组等价。
- 若两向量组等价,则它们能互相线性表出,因此它们的生成子空间互相包含,故相等。□
四、典型例子与反例
1. 正例
- 在 (\mathbb{R}^3) 中,(\operatorname{span}{(1,0,0), (0,1,0)}) 是xy平面,是 (\mathbb{R}^3) 的二维子空间。
- 在 (M_{2 \times 2}(F)) 中,所有对称矩阵构成的集合是子空间,它由 ({E_{11}, E_{12}+E_{21}, E_{22}}) 生成,维数为3。
- 在 (F[x]) 中,次数小于 (n) 的多项式空间 (F[x]_n) 是子空间,由 ({1, x, x^2, \dots, x^{n-1}}) 生成,维数为 (n)。
2. 反例
- 不包含零向量:(\mathbb{R}^2) 中第一象限的向量集合 ({(x,y) \mid x > 0, y > 0}),不包含零向量,不是子空间。
- 加法不封闭:(\mathbb{R}^2) 中两个坐标轴的并集 ({(x,0) \mid x \in \mathbb{R}} \cup {(0,y) \mid y \in \mathbb{R}}),加法不封闭(如 ((1,0) + (0,1) = (1,1)) 不在集合中),不是子空间。
- 数乘不封闭:(\mathbb{R}^2) 中所有分量为整数的向量集合,数乘不封闭(如 (0.5 \cdot (1,0) = (0.5, 0)) 不在集合中),不是子空间。
五、常见易错点总结
- 忽略零向量:子空间必须包含零向量,这是必要条件。
- 混淆子集与子空间:不是所有子集都是子空间,只有对加法和数乘封闭的非空子集才是子空间。
- 误以为并集是子空间:两个子空间的并集一般不是子空间,只有当一个包含另一个时才是子空间。
- 生成子空间的维数:生成子空间的维数等于向量组的秩,而不是向量的个数。例如,3个线性相关的向量生成的子空间维数最多是2。
- 运算一致性:子空间的运算必须与原空间一致,不能重新定义运算。
这是线性代数中最常用的判定定理之一,它将子空间的判定从需要验证8条线性空间公理,简化为只需验证2条封闭性条件,极大地降低了子空间验证的复杂度。下面我将为你补全教材中过于简略的证明细节,深入讲解引理的逻辑本质、等价表述、标准应用流程,并通过典型例子和反例帮助你彻底掌握这一核心工具。
一、引理完整表述与核心地位
引理5.2(子空间判定定理):设 (V) 是域 (F) 上的线性空间,(W) 是 (V) 的非空子集,则 (W) 是 (V) 的子空间当且仅当 (W) 对 (V) 中的加法和数乘运算封闭,即:
- 加法封闭性:对任意 (\alpha, \beta \in W),有 (\alpha + \beta \in W)
- 数乘封闭性:对任意 (\lambda \in F),(\alpha \in W),有 (\lambda \alpha \in W)
核心地位:这是判定一个集合是否为子空间的唯一标准,所有子空间的验证都必须通过这两个条件完成。它揭示了子空间的本质:原线性空间中一个对线性运算封闭的非空子集。
二、教材省略的完整证明
教材中仅用一句话带过证明,下面给出严格完整的证明过程:
证明:
必要性(⇒)
若 (W) 是 (V) 的子空间,则 (W) 本身是线性空间,自然对加法和数乘运算封闭,因此条件成立。
充分性(⇐)
若 (W) 非空且对加法和数乘封闭,我们需要验证线性空间的全部8条公理:
1. 加法公理验证
- 交换律:对任意 (\alpha, \beta \in W),因为 (\alpha, \beta \in V),而 (V) 是线性空间,所以 (\alpha + \beta = \beta + \alpha)。
- 结合律:对任意 (\alpha, \beta, \gamma \in W),同理有 ((\alpha + \beta) + \gamma = \alpha + (\beta + \gamma))。
- 零元存在性:因为 (W) 非空,取任意 (\alpha \in W)。由数乘封闭性,取 (\lambda = 0 \in F),则 (0 \cdot \alpha = 0 \in W)(这里用到了线性空间的基本性质:(0\alpha = 0))。因此 (V) 的零向量也在 (W) 中,是 (W) 的零元。
- 负元存在性:对任意 (\alpha \in W),由数乘封闭性,取 (\lambda = -1 \in F),则 ((-1) \cdot \alpha = -\alpha \in W)(这里用到了线性空间的基本性质:((-1)\alpha = -\alpha))。因此 (\alpha) 的负向量也在 (W) 中。
2. 数乘公理验证
- 数乘对向量加法的分配律:对任意 (\lambda \in F),(\alpha, \beta \in W),有 (\lambda(\alpha + \beta) = \lambda \alpha + \lambda \beta)(继承自 (V))。
- 数乘对域加法的分配律:对任意 (\lambda, \mu \in F),(\alpha \in W),有 ((\lambda + \mu)\alpha = \lambda \alpha + \mu \alpha)(继承自 (V))。
- 数乘结合律:对任意 (\lambda, \mu \in F),(\alpha \in W),有 ((\lambda \mu)\alpha = \lambda(\mu \alpha))(继承自 (V))。
- 数乘单位元:对任意 (\alpha \in W),有 (1 \cdot \alpha = \alpha)(继承自 (V))。
综上,(W) 满足线性空间的全部8条公理,因此是 (V) 的子空间。□
关键逻辑:除了零元和负元需要通过封闭性证明存在性外,其余6条公理都自动继承自原线性空间 (V),不需要额外验证。这就是为什么只需要验证两条封闭性的根本原因。
三、等价判定条件(更实用的形式)
在实际应用中,我们经常使用以下等价条件,它将两条封闭性合并为一条,有时更方便:
推论:设 (W) 是线性空间 (V) 的非空子集,则 (W) 是 (V) 的子空间当且仅当对任意 (\alpha, \beta \in W),(\lambda, \mu \in F),有
[\lambda \alpha + \mu \beta \in W]
证明:
- 必要性:若 (W) 是子空间,则由数乘封闭性,(\lambda \alpha \in W),(\mu \beta \in W);再由加法封闭性,(\lambda \alpha + \mu \beta \in W)。
- 充分性:若对任意 (\alpha, \beta \in W),(\lambda, \mu \in F),有 (\lambda \alpha + \mu \beta \in W),则:
- 取 (\lambda = \mu = 1),得 (\alpha + \beta \in W)(加法封闭)。
- 取 (\mu = 0),得 (\lambda \alpha \in W)(数乘封闭)。
由引理5.2,(W) 是子空间。□
四、标准应用流程
验证一个集合 (W) 是线性空间 (V) 的子空间,严格按照以下三步进行:
- 验证非空性:证明 (W) 不是空集,通常通过证明零向量属于 (W) 来完成(这是最快捷的方法)。
- 验证加法封闭性:任取 (\alpha, \beta \in W),证明 (\alpha + \beta \in W)。
- 验证数乘封闭性:任取 (\lambda \in F),(\alpha \in W),证明 (\lambda \alpha \in W)。
注意:三步缺一不可!尤其是非空性,很多学生容易忽略。空集满足加法和数乘封闭(空真命题),但它不是子空间,因为线性空间必须包含零向量。
五、典型例子与反例
1. 正例(子空间)
例1:齐次线性方程组的解空间
设 (A) 是 (m \times n) 矩阵,(W = { x \in F^n \mid Ax = 0 }) 是齐次线性方程组 (Ax = 0) 的所有解的集合,则 (W) 是 (F^n) 的子空间,称为 (A) 的零空间或核空间。
验证:
- 非空性:(A0 = 0),故零向量 (0 \in W)。
- 加法封闭性:若 (x_1, x_2 \in W),则 (Ax_1 = 0),(Ax_2 = 0),于是 (A(x_1 + x_2) = Ax_1 + Ax_2 = 0 + 0 = 0),故 (x_1 + x_2 \in W)。
- 数乘封闭性:若 (x \in W),(\lambda \in F),则 (A(\lambda x) = \lambda Ax = \lambda 0 = 0),故 (\lambda x \in W)。
因此 (W) 是 (F^n) 的子空间。
例2:对称矩阵空间
设 (W = { A \in M_n(F) \mid A^T = A }) 是所有 (n) 阶对称矩阵的集合,则 (W) 是 (M_n(F)) 的子空间。
验证:
- 非空性:零矩阵是对称矩阵,故 (0 \in W)。
- 加法封闭性:若 (A, B \in W),则 (A^T = A),(B^T = B),于是 ((A + B)^T = A^T + B^T = A + B),故 (A + B \in W)。
- 数乘封闭性:若 (A \in W),(\lambda \in F),则 ((\lambda A)^T = \lambda A^T = \lambda A),故 (\lambda A \in W)。
因此 (W) 是 (M_n(F)) 的子空间。
2. 反例(不是子空间)
反例1:不包含零向量
(W = { (x, y) \in \mathbb{R}^2 \mid x > 0, y > 0 })(第一象限)。
- 不包含零向量 ((0,0)),因此不是子空间。
反例2:加法不封闭
(W = { (x, y) \in \mathbb{R}^2 \mid x = 0 \text{ 或 } y = 0 })(两个坐标轴的并集)。
- 取 (\alpha = (1, 0) \in W),(\beta = (0, 1) \in W),但 (\alpha + \beta = (1, 1) \notin W),加法不封闭,因此不是子空间。
反例3:数乘不封闭
(W = { (x, y) \in \mathbb{R}^2 \mid x, y \text{ 都是整数} })。
- 取 (\alpha = (1, 0) \in W),(\lambda = 0.5 \in \mathbb{R}),但 (\lambda \alpha = (0.5, 0) \notin W),数乘不封闭,因此不是子空间。
六、常见易错点总结
- 忽略非空性:空集满足封闭性但不是子空间,必须验证非空。
- 混淆子集与子空间:不是所有子集都是子空间,只有对线性运算封闭的非空子集才是。
- 误以为并集是子空间:两个子空间的并集一般不是子空间,只有当一个包含另一个时才是。
- 运算不一致:子空间的运算必须与原空间完全一致,不能重新定义运算。
- 零向量的位置:子空间的零向量必须是原空间的零向量,不能是其他元素。
七、后续课程衔接
子空间是线性代数后续几乎所有内容的基础:
- 线性方程组:齐次线性方程组的解空间是子空间,非齐次线性方程组的解集是子空间的陪集。
- 矩阵理论:矩阵的零空间、列空间、行空间都是子空间,它们的维数满足秩-零度定理。
- 线性变换:线性变换的核与像都是子空间,是研究线性变换结构的核心工具。
- 欧氏空间:正交补是子空间,是正交分解定理的基础。
这是整个线性代数的核心定义,它定义了线性空间之间保持线性运算的映射——线性映射。线性代数的本质就是研究线性空间和线性映射的理论,后续所有内容(矩阵表示、核与像、同构、特征值、若尔当标准形等)都围绕这一概念展开。下面我将为你深度解析定义的本质,补充教材省略的基本性质,辨析易混淆概念,并通过典型例子建立直观理解。
一、定义核心解读
定义5.7 指出:设 (V_1) 和 (V_2) 是域 (F) 上的两个线性空间,若映射 (\varphi: V_1 \rightarrow V_2) 满足以下两个条件,则称 (\varphi) 为线性映射:
- 加法保持性:对任意 (\alpha, \beta \in V_1),有 (\varphi(\alpha + \beta) = \varphi(\alpha) + \varphi(\beta))
- 数乘保持性:对任意 (\lambda \in F),(\alpha \in V_1),有 (\varphi(\lambda \alpha) = \lambda \varphi(\alpha))
本质含义:线性映射是保持线性运算结构的映射。也就是说,先在 (V_1) 中做线性运算,再映射到 (V_2),与先映射到 (V_2),再做线性运算,结果完全相同。这是线性映射最根本的特征。
等价判定条件(更常用)
两个条件可以合并为一个更简洁的条件,在证明中几乎总是使用这个形式:
映射 (\varphi: V_1 \rightarrow V_2) 是线性映射当且仅当对任意 (\alpha, \beta \in V_1),(\lambda, \mu \in F),有
[\varphi(\lambda \alpha + \mu \beta) = \lambda \varphi(\alpha) + \mu \varphi(\beta)]
证明:
- 若 (\varphi) 满足原定义,则 (\varphi(\lambda \alpha + \mu \beta) = \varphi(\lambda \alpha) + \varphi(\mu \beta) = \lambda \varphi(\alpha) + \mu \varphi(\beta))。
- 若 (\varphi) 满足合并条件,取 (\lambda = \mu = 1) 得加法保持性,取 (\mu = 0) 得数乘保持性。
二、线性映射的基本性质(教材省略)
由定义可以直接推出线性映射的以下基本性质,它们是所有后续证明的基础:
- 零向量映到零向量:(\varphi(0) = 0)
- 证明:(\varphi(0) = \varphi(0 \cdot 0) = 0 \cdot \varphi(0) = 0)
- 负向量映到负向量:(\varphi(-\alpha) = -\varphi(\alpha))
- 证明:(\varphi(-\alpha) = \varphi((-1)\alpha) = (-1)\varphi(\alpha) = -\varphi(\alpha))
- 保持线性组合:对任意 (\alpha_1, \dots, \alpha_k \in V_1),(\lambda_1, \dots, \lambda_k \in F),有
[\varphi\left(\sum_{i=1}^k \lambda_i \alpha_i\right) = \sum_{i=1}^k \lambda_i \varphi(\alpha_i)]- 证明:由数学归纳法,对 (k) 归纳可得。
重要推论:线性映射完全由它在一组基上的取值决定。也就是说,如果两个线性映射在 (V_1) 的一组基上的取值相同,那么它们在整个 (V_1) 上完全相同。这是线性映射矩阵表示的理论基础。
三、三个易混淆概念辨析
教材中同时提到了三个相关概念,很多学生容易混淆,下面明确它们的关系:
| 概念 | 定义 | 特殊之处 | 典型例子 |
|---|---|---|---|
| 线性映射 | 任意两个线性空间 (V_1 \rightarrow V_2) 之间保持线性运算的映射 | 最一般的概念 | 矩阵乘法 (A: F^n \rightarrow F^m) |
| 线性函数 | 当 (V_2 = F)(基域)时的线性映射 | 映射到数域,也称为线性泛函 | 定积分 (\int_a^b: C[a,b] \rightarrow \mathbb{R}) |
| 线性变换 | 线性空间到自身的线性映射 (V \rightarrow V) | 定义域和值域相同 | 求导运算 (\frac{d}{dx}: F[x] \rightarrow F[x]) |
包含关系:线性变换 ⊂ 线性映射,线性函数 ⊂ 线性映射。线性变换和线性函数都是特殊的线性映射。
四、典型线性映射例子
线性映射无处不在,下面给出不同线性空间中的典型例子:
1. 数组空间上的线性映射:矩阵乘法
设 (A) 是 (m \times n) 矩阵,定义映射
[\varphi_A: F^n \rightarrow F^m, \quad \varphi_A(x) = Ax]
则 (\varphi_A) 是线性映射。
- 加法保持性:(A(x + y) = Ax + Ay)
- 数乘保持性:(A(\lambda x) = \lambda Ax)
重要结论:有限维线性空间之间的所有线性映射都可以表示为矩阵乘法。这就是为什么矩阵理论是线性代数的核心工具。
2. 多项式空间上的线性变换:求导与积分
- 求导变换:定义 (D: F[x] \rightarrow F[x]),(D(f(x)) = f'(x))
- 线性性:((f + g)' = f' + g'),((\lambda f)' = \lambda f')
- 积分变换:定义 (I: F[x] \rightarrow F[x]),(I(f(x)) = \int_0^x f(t)dt)
- 线性性:(\int_0^x (f + g)dt = \int_0^x f dt + \int_0^x g dt),(\int_0^x \lambda f dt = \lambda \int_0^x f dt)
3. 连续函数空间上的线性函数:定积分
定义映射
[I: C[a,b] \rightarrow \mathbb{R}, \quad I(f) = \int_a^b f(x)dx]
则 (I) 是线性函数。
- 线性性:(\int_a^b (f + g)dx = \int_a^b f dx + \int_a^b g dx),(\int_a^b \lambda f dx = \lambda \int_a^b f dx)
4. 坐标映射:线性同构
设 (B = {\alpha_1, \dots, \alpha_n}) 是 (V) 的一组有序基,定义坐标映射
[\varphi_B: V \rightarrow F^n, \quad \varphi_B(\alpha) = (a_1, \dots, a_n)^T]
其中 (\alpha = a_1\alpha_1 + \dots + a_n\alpha_n)。则 (\varphi_B) 是双射线性映射,称为线性同构。
五、几何直观(以 (\mathbb{R}^2) 为例)
在二维实空间 (\mathbb{R}^2) 中,线性变换对应平面上的几何变换,所有保持原点不动的变换都是线性变换:
- 旋转变换:绕原点旋转 (\theta) 角
- 反射变换:关于x轴、y轴或原点的反射
- 缩放变换:沿x轴或y轴方向的缩放
- 剪切变换:保持x轴不变,y轴方向发生剪切
注意:平移变换不是线性变换!例如,(T(x, y) = (x + 1, y)) 不是线性变换,因为它不把零向量映到零向量:(T(0,0) = (1,0) \neq (0,0))。平移是仿射变换,不是线性变换。
六、常见易错点总结
- 混淆线性映射与仿射映射:形如 (f(x) = Ax + b) 的映射是仿射映射,当且仅当 (b = 0) 时才是线性映射。
- 忽略零向量条件:线性映射必须把零向量映到零向量,这是必要条件。如果一个映射不满足这一点,它一定不是线性映射。
- 误以为所有映射都是线性的:绝大多数映射都不是线性的,线性映射是非常特殊的一类映射。
- 混淆线性映射与线性变换:线性变换是到自身的线性映射,是线性映射的特例。
七、理论意义
线性映射的定义是线性代数的分水岭。在此之前,我们研究的是单个线性空间的内部结构;在此之后,我们开始研究不同线性空间之间的关系。线性映射的引入使得我们可以:
- 将抽象线性空间的问题转化为具体的矩阵问题
- 通过研究线性映射的核与像来刻画线性空间的结构
- 建立不同线性空间之间的同构关系,证明它们在代数上是等价的
这是无限维线性空间上线性变换的经典原型——多项式求导算子,它不仅是线性映射定义的绝佳例证,更深刻展示了有限维与无限维线性变换的本质区别,同时也是泛函分析中微分算子理论的代数基础。下面我将为你严格证明其线性性,深入讲解它在有限维和无限维多项式空间上的矩阵表示、核与像结构,并对比积分映射进行拓展分析。
一、严格证明:求导映射是线性映射
定义:设 (F[x]) 是域 (F) 上的全体多项式空间,定义映射
[\mathcal{D}: F[x] \rightarrow F[x], \quad \mathcal{D}(f(x)) = f'(x)]
其中 (f'(x)) 是多项式 (f(x)) 的形式导数:若 (f(x) = a_0 + a_1x + a_2x^2 + \dots + a_nx^n),则
[f'(x) = a_1 + 2a_2x + 3a_3x^2 + \dots + na_nx^{n-1}]
证明:我们验证线性映射的两个条件:
-
加法保持性:对任意 (f(x), g(x) \in F[x]),有
[\mathcal{D}(f(x) + g(x)) = (f(x) + g(x))' = f'(x) + g'(x) = \mathcal{D}(f(x)) + \mathcal{D}(g(x))]
这是多项式形式导数的基本性质:和的导数等于导数的和。 -
数乘保持性:对任意 (\lambda \in F),(f(x) \in F[x]),有
[\mathcal{D}(\lambda f(x)) = (\lambda f(x))' = \lambda f'(x) = \lambda \mathcal{D}(f(x))]
这是多项式形式导数的基本性质:数乘的导数等于数乘导数。
因此,(\mathcal{D}) 满足线性映射的定义,是 (F[x]) 上的线性变换。□
关键说明:这里的导数是纯代数定义的形式导数,不需要任何极限概念,因此在任意域上都成立,不仅仅是实数域或复数域。这体现了线性代数的抽象性和普适性。
二、有限维多项式空间上的求导变换
当我们将求导映射限制在有限维多项式空间 (F[x]_n)(次数小于 (n) 的多项式全体)上时,它成为一个有限维线性变换,我们可以用矩阵来表示它。
1. 矩阵表示
取 (F[x]_n) 的标准有序基:
[B = {1, x, x^2, \dots, x^{n-1}}]
计算基向量在 (\mathcal{D}) 下的像:
- (\mathcal{D}(1) = 0 = 0 \cdot 1 + 0 \cdot x + 0 \cdot x^2 + \dots + 0 \cdot x^{n-1})
- (\mathcal{D}(x) = 1 = 1 \cdot 1 + 0 \cdot x + 0 \cdot x^2 + \dots + 0 \cdot x^{n-1})
- (\mathcal{D}(x^2) = 2x = 0 \cdot 1 + 2 \cdot x + 0 \cdot x^2 + \dots + 0 \cdot x^{n-1})
- (\mathcal{D}(x^3) = 3x^2 = 0 \cdot 1 + 0 \cdot x + 3 \cdot x^2 + \dots + 0 \cdot x^{n-1})
- ...
- (\mathcal{D}(x^{n-1}) = (n-1)x^{n-2} = 0 \cdot 1 + 0 \cdot x + \dots + (n-1) \cdot x^{n-2} + 0 \cdot x^{n-1})
因此,(\mathcal{D}) 在基 (B) 下的矩阵为:
[
A = \begin{pmatrix}
0 & 1 & 0 & \dots & 0 \
0 & 0 & 2 & \dots & 0 \
0 & 0 & 0 & \dots & 0 \
\vdots & \vdots & \vdots & \ddots & n-1 \
0 & 0 & 0 & \dots & 0
\end{pmatrix}_{n \times n}
]
这是一个严格上三角矩阵,主对角线全为0,次对角线元素依次为 (1, 2, \dots, n-1),其余元素全为0。
2. 核与像的计算
-
核(零空间):(\ker \mathcal{D} = { f(x) \in F[x]_n \mid f'(x) = 0 })
导数为0的多项式只能是常数多项式,因此
[\ker \mathcal{D} = \operatorname{span}{1}, \quad \dim \ker \mathcal{D} = 1] -
像(值域):(\operatorname{Im} \mathcal{D} = { f'(x) \mid f(x) \in F[x]n })
次数小于 (n) 的多项式的导数是次数小于 (n-1) 的多项式,因此
[\operatorname{Im} \mathcal{D} = F[x], \quad \dim \operatorname{Im} \mathcal{D} = n-1]
3. 秩-零度定理验证
秩-零度定理指出:对有限维线性空间上的线性变换 (\mathcal{T}),有
[\dim \ker \mathcal{T} + \dim \operatorname{Im} \mathcal{T} = \dim V]
对于求导变换 (\mathcal{D}: F[x]_n \rightarrow F[x]_n):
[1 + (n-1) = n = \dim F[x]_n]
完全符合秩-零度定理。
三、无限维多项式空间上的求导变换
当我们考虑全体多项式空间 (F[x])(无限维)时,求导变换的性质发生了本质变化:
- 核:(\ker \mathcal{D} = \operatorname{span}{1}),维数仍为1(只有常数多项式的导数为0)
- 像:(\operatorname{Im} \mathcal{D} = F[x]),即求导变换是满射!
这是因为对任意多项式 (g(x) \in F[x]),都存在原函数 (f(x) = \int_0^x g(t)dt \in F[x]),使得 (\mathcal{D}(f(x)) = g(x))。
关键区别:在有限维空间中,单射等价于满射等价于双射;但在无限维空间中,这个结论不成立。求导变换 (\mathcal{D}: F[x] \rightarrow F[x]) 是满射但不是单射(因为核非零),而积分变换是单射但不是满射。
四、对比:积分映射(线性映射的另一个典型例子)
作为对比,我们考虑积分映射:
[\mathcal{I}: F[x] \rightarrow F[x], \quad \mathcal{I}(f(x)) = \int_0^x f(t)dt]
若 (f(x) = a_0 + a_1x + \dots + a_nx^n),则
[\mathcal{I}(f(x)) = a_0x + \frac{a_1}{2}x^2 + \dots + \frac{a_n}{n+1}x^{n+1}]
性质:
-
线性性:积分映射也是线性映射,验证如下:
[\mathcal{I}(f + g) = \int_0^x (f + g)dt = \int_0^x f dt + \int_0^x g dt = \mathcal{I}(f) + \mathcal{I}(g)]
[\mathcal{I}(\lambda f) = \int_0^x \lambda f dt = \lambda \int_0^x f dt = \lambda \mathcal{I}(f)] -
核与像:
- 核:(\ker \mathcal{I} = {0})(只有零多项式的积分是零多项式),因此是单射
- 像:(\operatorname{Im} \mathcal{I} = { f(x) \in F[x] \mid f(0) = 0 })(所有常数项为0的多项式),因此不是满射
-
复合运算:
- (\mathcal{D} \circ \mathcal{I} = \text{id})(先积分再求导等于恒等变换)
- (\mathcal{I} \circ \mathcal{D} \neq \text{id})(先求导再积分不等于恒等变换,因为常数项丢失了)
五、常见易错点总结
- 有限维与无限维的区别:不要将有限维线性变换的性质(单射等价于满射)推广到无限维。
- 积分映射的定义域与值域:积分映射 (\mathcal{I}) 不是 (F[x]_n) 到自身的线性变换,因为次数小于 (n) 的多项式积分后次数为 (n),超出了 (F[x]_n) 的范围。
- 形式导数的域通用性:多项式的形式导数在任意域上都有定义,不需要极限概念,这与数学分析中的导数不同。
- 求导变换的幂零性:有限维空间上的求导变换是幂零变换,即 (\mathcal{D}^n = 0)(对任意 (f(x) \in F[x]_n),求导 (n) 次后必为零多项式)。
六、理论意义
求导变换是线性代数中最重要的例子之一,它的意义在于:
- 它是无限维线性空间上线性变换的典型代表,展示了无限维与有限维线性变换的本质区别。
- 它是微分算子的代数原型,泛函分析中的微分算子理论就是在这个基础上发展起来的。
- 它的矩阵表示是幂零矩阵的标准形式,在若尔当标准形理论中具有重要地位。
这是线性代数中最核心的对应关系,它建立了抽象线性映射与具体矩阵乘法之间的等价性,是整个矩阵理论的基石。教材中仅给出了结论,下面我将为你补全所有结论的严格证明,深入解析其逻辑本质,补充秩-零度定理的具体体现,并指出常见的理解误区。
一、严格证明:矩阵乘法是线性映射
定义:设 (A) 是域 (F) 上的 (m \times n) 矩阵,定义映射
[\mathscr{A}: F^{(n)} \rightarrow F^{(m)}, \quad \mathscr{A}(x) = Ax]
其中 (F^{(n)}) 和 (F^{(m)}) 分别是 (n) 维和 (m) 维列向量空间。
证明:验证线性映射的两个条件:
-
加法保持性:对任意 (x_1, x_2 \in F^{(n)}),有
[\mathscr{A}(x_1 + x_2) = A(x_1 + x_2) = Ax_1 + Ax_2 = \mathscr{A}(x_1) + \mathscr{A}(x_2)]
这是矩阵乘法对加法的分配律。 -
数乘保持性:对任意 (\lambda \in F),(x \in F^{(n)}),有
[\mathscr{A}(\lambda x) = A(\lambda x) = \lambda Ax = \lambda \mathscr{A}(x)]
这是矩阵乘法与数乘的结合律。
因此,(\mathscr{A}) 满足线性映射的定义,是从 (F^{(n)}) 到 (F^{(m)}) 的线性映射。□
二、核心结论的完整证明
教材中给出了四个关键结论,下面逐一给出严格证明:
结论1:(\mathscr{A}) 是单射当且仅当 (A) 是列满秩矩阵(列向量线性无关)
证明:
-
必要性(⇒):若 (\mathscr{A}) 是单射,则齐次线性方程组 (Ax = 0) 只有零解。
因为若 (Ax = 0),则 (\mathscr{A}(x) = \mathscr{A}(0)),由单射性得 (x = 0)。
齐次方程组只有零解当且仅当系数矩阵 (A) 的列向量线性无关,即 (r(A) = n)(列满秩)。 -
充分性(⇐):若 (A) 列满秩,则齐次方程组 (Ax = 0) 只有零解。
若 (\mathscr{A}(x_1) = \mathscr{A}(x_2)),则 (Ax_1 = Ax_2),即 (A(x_1 - x_2) = 0),故 (x_1 - x_2 = 0),即 (x_1 = x_2),因此 (\mathscr{A}) 是单射。□
结论2:(\mathscr{A}) 是满射当且仅当 (A) 是行满秩矩阵(行向量线性无关)
证明:
-
必要性(⇒):若 (\mathscr{A}) 是满射,则对任意 (y \in F^{(m)}),存在 (x \in F^{(n)}) 使得 (Ax = y)。
这意味着非齐次线性方程组 (Ax = y) 对任意右端项 (y) 都有解。
根据线性方程组解的存在性定理,(Ax = y) 有解当且仅当 (r(A) = r(A | y))。
要使上式对任意 (y) 都成立,必须有 (r(A) = m)(行满秩),否则可以取 (y) 不在 (A) 的列空间中,此时 (r(A | y) = r(A) + 1 > r(A)),方程组无解。 -
充分性(⇐):若 (A) 行满秩,即 (r(A) = m),则对任意 (y \in F^{(m)}),有
[r(A) = m \leq r(A | y) \leq m]
故 (r(A) = r(A | y)),因此方程组 (Ax = y) 有解,即 (\mathscr{A}) 是满射。□
结论3:(\ker \mathscr{A}) 是齐次线性方程组 (Ax = 0) 的解空间
证明:
根据核的定义:
[\ker \mathscr{A} = { x \in F^{(n)} \mid \mathscr{A}(x) = 0 } = { x \in F^{(n)} \mid Ax = 0 }]
这正是齐次线性方程组 (Ax = 0) 的所有解的集合,即解空间。□
结论4:(\operatorname{Im} \mathscr{A}) 是矩阵 (A) 的列向量张成的空间(列空间)
证明:
设 (A = (\alpha_1, \alpha_2, \dots, \alpha_n)),其中 (\alpha_1, \dots, \alpha_n) 是 (A) 的列向量。
对任意 (x = (x_1, x_2, \dots, x_n)^T \in F^{(n)}),有
[Ax = x_1\alpha_1 + x_2\alpha_2 + \dots + x_n\alpha_n]
这说明 (Ax) 是 (A) 的列向量的线性组合。反之,(A) 的列向量的任意线性组合都可以表示为 (Ax) 的形式。因此:
[\operatorname{Im} \mathscr{A} = { Ax \mid x \in F^{(n)} } = \operatorname{span}{\alpha_1, \alpha_2, \dots, \alpha_n}]
即 (\operatorname{Im} \mathscr{A}) 是 (A) 的列空间。□
三、秩-零度定理的具体体现
对于线性映射 (\mathscr{A}: F^{(n)} \rightarrow F^{(m)}),秩-零度定理指出:
[\dim \ker \mathscr{A} + \dim \operatorname{Im} \mathscr{A} = \dim F^{(n)} = n]
结合我们的结论:
- (\dim \ker \mathscr{A}) 是齐次方程组 (Ax = 0) 的解空间维数,即 基础解系所含向量个数,等于 (n - r(A))
- (\dim \operatorname{Im} \mathscr{A}) 是 (A) 的列空间维数,即 矩阵 (A) 的秩 (r(A))
代入秩-零度定理:
[(n - r(A)) + r(A) = n]
完美验证了定理的正确性。这也解释了为什么齐次方程组解空间的维数等于未知数个数减去系数矩阵的秩。
四、特殊情况:方阵的线性变换
当 (m = n) 时,(A) 是 (n) 阶方阵,此时 (\mathscr{A}) 是 (F^{(n)}) 上的线性变换,有以下等价条件:
- (\mathscr{A}) 是单射
- (\mathscr{A}) 是满射
- (\mathscr{A}) 是双射(可逆线性变换)
- (A) 是可逆矩阵(非奇异矩阵)
- (r(A) = n)(满秩)
- (|A| \neq 0)(行列式非零)
- (A) 的行向量线性无关
- (A) 的列向量线性无关
- 齐次方程组 (Ax = 0) 只有零解
- 非齐次方程组 (Ax = b) 对任意 (b) 有唯一解
这是有限维线性空间的特有性质:单射等价于满射等价于双射。在无限维空间中,这个结论不成立(如之前讲的求导变换是满射但不是单射)。
五、理论意义与核心地位
这个例子是整个线性代数的枢纽,它的意义在于:
- 抽象与具体的桥梁:所有有限维线性空间之间的线性映射都可以表示为矩阵乘法。具体来说,设 (V) 和 (W) 是有限维线性空间,(\varphi: V \rightarrow W) 是线性映射,取定 (V) 和 (W) 的基后,(\varphi) 可以唯一地表示为一个矩阵 (A),使得 (\varphi) 的作用对应于矩阵乘法 (Ax)。
- 矩阵理论的基础:矩阵的秩、可逆性、列空间、零空间等概念,本质上都是对应的线性映射的性质。
- 计算的基础:所有线性映射的运算(加法、数乘、复合)都对应于矩阵的运算,这使得我们可以通过矩阵计算来研究抽象的线性映射。
六、常见易错点总结
- 混淆列空间与行空间:线性映射 (\mathscr{A}(x) = Ax) 的像是 (A) 的列空间,不是行空间。
- 混淆单射与满射的条件:单射对应列满秩,满射对应行满秩,不要搞反。
- 忽略维数条件:单射等价于满射仅在有限维空间中成立,且仅当定义域和值域维数相同时成立。
- 零空间与解空间的关系:零空间就是齐次方程组的解空间,这是最基本的对应关系。
这是线性代数中最优美的跨领域例子之一,它建立了复数域与2×2实矩阵代数之间的深刻联系,不仅是线性映射的典型例证,更是代数同构和几何表示的完美结合。下面我将为你严格证明所有结论,深入解析其几何本质,补充教材省略的关键性质,并讲解其在数学和工程中的广泛应用。
一、严格证明:映射是线性单射
定义:设 (\mathbb{C}) 是实数域 (\mathbb{R}) 上的二维线性空间,(M_2(\mathbb{R})) 是实数域上的2×2矩阵空间,定义映射
[\varphi: \mathbb{C} \rightarrow M_2(\mathbb{R}), \quad \varphi(a + bi) = \begin{pmatrix} a & -b \ b & a \end{pmatrix}]
1. 证明线性性
对任意 (z_1 = a_1 + b_1i, z_2 = a_2 + b_2i \in \mathbb{C}),(\lambda \in \mathbb{R}):
- 加法保持性:
[
\begin{align}
\varphi(z_1 + z_2) &= \varphi((a_1+a_2) + (b_1+b_2)i) \
&= \begin{pmatrix} a_1+a_2 & -(b_1+b_2) \ b_1+b_2 & a_1+a_2 \end{pmatrix} \
&= \begin{pmatrix} a_1 & -b_1 \ b_1 & a_1 \end{pmatrix} + \begin{pmatrix} a_2 & -b_2 \ b_2 & a_2 \end{pmatrix} \
&= \varphi(z_1) + \varphi(z_2)
\end{align}
] - 数乘保持性:
[
\begin{align}
\varphi(\lambda z_1) &= \varphi(\lambda a_1 + \lambda b_1i) \
&= \begin{pmatrix} \lambda a_1 & -\lambda b_1 \ \lambda b_1 & \lambda a_1 \end{pmatrix} \
&= \lambda \begin{pmatrix} a_1 & -b_1 \ b_1 & a_1 \end{pmatrix} \
&= \lambda \varphi(z_1)
\end{align}
]
因此 (\varphi) 是线性映射。
2. 证明单射性
单射等价于核为零空间,即 (\ker \varphi = {0})。
若 (\varphi(z) = 0)(零矩阵),则
[\begin{pmatrix} a & -b \ b & a \end{pmatrix} = \begin{pmatrix} 0 & 0 \ 0 & 0 \end{pmatrix}]
故 (a = 0) 且 (b = 0),即 (z = 0)。因此 (\ker \varphi = {0}),(\varphi) 是单射。□
二、核心性质:乘法保持性(代数同态)
教材中提到的 (\varphi(z_1 z_2) = \varphi(z_1)\varphi(z_2)) 是这个映射最深刻的性质,它说明 (\varphi) 不仅保持线性运算,还保持乘法运算,是代数同态。
严格证明:
对任意 (z_1 = a_1 + b_1i, z_2 = a_2 + b_2i \in \mathbb{C}),
- 左边:(z_1 z_2 = (a_1a_2 - b_1b_2) + (a_1b_2 + a_2b_1)i),故
[\varphi(z_1 z_2) = \begin{pmatrix} a_1a_2 - b_1b_2 & -(a_1b_2 + a_2b_1) \ a_1b_2 + a_2b_1 & a_1a_2 - b_1b_2 \end{pmatrix}] - 右边:
[
\begin{align}
\varphi(z_1)\varphi(z_2) &= \begin{pmatrix} a_1 & -b_1 \ b_1 & a_1 \end{pmatrix} \begin{pmatrix} a_2 & -b_2 \ b_2 & a_2 \end{pmatrix} \
&= \begin{pmatrix} a_1a_2 - b_1b_2 & -a_1b_2 - b_1a_2 \ b_1a_2 + a_1b_2 & -b_1b_2 + a_1a_2 \end{pmatrix}
\end{align}
]
两边完全相等,故 (\varphi(z_1 z_2) = \varphi(z_1)\varphi(z_2))。□
推论:
- (\varphi(1) = \begin{pmatrix} 1 & 0 \ 0 & 1 \end{pmatrix} = I)(单位矩阵)
- 若 (z \neq 0),则 (\varphi(z^{-1}) = \varphi(z)^{-1})(可逆元的像仍是可逆元,且逆元的像等于像的逆元)
三、几何本质:复数乘法与平面变换的对应
这个映射的几何意义极其深刻:它将复数的乘法转化为平面上的旋转缩放变换。
1. 复数的极坐标表示
任意非零复数 (z = a + bi) 可以表示为极坐标形式:
[z = r(\cos\theta + i\sin\theta)]
其中 (r = |z| = \sqrt{a^2 + b^2}) 是复数的模,(\theta = \arg(z)) 是复数的辐角。
2. 对应的矩阵形式
代入映射 (\varphi),得:
[\varphi(z) = \begin{pmatrix} r\cos\theta & -r\sin\theta \ r\sin\theta & r\cos\theta \end{pmatrix} = r \begin{pmatrix} \cos\theta & -\sin\theta \ \sin\theta & \cos\theta \end{pmatrix}]
这正是平面上的旋转缩放矩阵:
- 先绕原点旋转 (\theta) 角
- 再沿所有方向缩放 (r) 倍
因此,复数乘法 (w \mapsto z w) 等价于平面上的旋转缩放变换,这就是复数乘法的几何解释。
四、像空间的结构
映射 (\varphi) 的像空间是 (M_2(\mathbb{R})) 的一个二维子代数,记为 (S):
[S = \operatorname{Im} \varphi = \left{ \begin{pmatrix} a & -b \ b & a \end{pmatrix} \mid a, b \in \mathbb{R} \right}]
1. 基与维数
(S) 的一组标准基为:
[E = \varphi(1) = \begin{pmatrix} 1 & 0 \ 0 & 1 \end{pmatrix}, \quad J = \varphi(i) = \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix}]
显然 (E) 和 (J) 线性无关,且 (S = \operatorname{span}{E, J}),故 (\dim S = 2)。
2. 基的乘法关系
基元素满足以下乘法关系:
- (E^2 = E)(单位矩阵的平方是自身)
- (J^2 = -E)(对应 (i^2 = -1))
- (EJ = JE = J)(单位矩阵与任何矩阵交换)
这完全复制了复数域的乘法结构,因此 (\varphi: \mathbb{C} \rightarrow S) 是代数同构,即 (\mathbb{C} \cong S)。
五、补充性质与应用
1. 共轭与转置的对应
复数的共轭对应矩阵的转置:
[\varphi(\overline{z}) = \varphi(a - bi) = \begin{pmatrix} a & b \ -b & a \end{pmatrix} = \begin{pmatrix} a & -b \ b & a \end{pmatrix}^T = \varphi(z)^T]
2. 模与行列式的对应
复数模的平方对应矩阵的行列式:
[\det \varphi(z) = \det \begin{pmatrix} a & -b \ b & a \end{pmatrix} = a^2 + b^2 = |z|^2]
3. 工程应用
这个同构在工程领域有广泛应用:
- 计算机图形学:平面旋转和缩放变换可以用复数或对应的矩阵表示,复数运算比矩阵运算更简洁。
- 信号处理:傅里叶变换中的复指数可以用矩阵表示,便于硬件实现。
- 控制理论:线性系统的复频域分析可以转化为矩阵分析。
六、常见易错点总结
- 不是满射:(M_2(\mathbb{R})) 是四维空间,而像空间 (S) 是二维的,因此 (\varphi) 只是单射,不是满射。
- 基域是实数域:(\varphi) 是 (\mathbb{R}) 上的线性映射,不是 (\mathbb{C}) 上的,因为数乘只对实数成立。
- 乘法保持性是额外性质:一般的线性映射不保持乘法,只有代数同态才保持,这是这个例子的特殊之处。
- 几何变换的顺序:复数乘法对应的变换是先旋转后缩放,顺序不能颠倒。
七、理论意义
这个例子是代数结构表示论的雏形,它告诉我们:
抽象的代数结构(如复数域)可以用具体的矩阵代数来表示,所有抽象运算都可以转化为具体的矩阵运算。
这种思想后来发展成为群表示论、环表示论等重要数学分支,是现代数学的核心思想之一。
这是线性映射理论的核心基础,系统总结了线性映射的基本运算性质和两个最重要的不变子空间——核与像。教材中仅给出了结论和简略说明,下面我将为你补全所有省略的严格证明,深入解析每个性质的逻辑本质和几何意义,补充最核心的秩-零度定理,并通过典型例子建立直观理解。
一、线性映射的基本运算性质
性质1:零向量映到零向量
结论:对任意线性映射 (\varphi: V_1 \rightarrow V_2),有 (\varphi(0) = 0)。
教材证明补全:
由线性映射的加法保持性,
[\varphi(0) = \varphi(0 + 0) = \varphi(0) + \varphi(0)]
两边同时加上 (-\varphi(0)),得
[0 = \varphi(0)]
□
重要应用:这是判断一个映射不是线性映射的快速方法。如果一个映射不把零向量映到零向量,它一定不是线性映射。例如,平移变换 (T(x) = x + b)((b \neq 0))不是线性映射,因为 (T(0) = b \neq 0)。
性质2:保持有限线性组合
结论:对任意 (\alpha_1, \dots, \alpha_m \in V_1),(\lambda_1, \dots, \lambda_m \in F),有
[\varphi\left(\sum_{i=1}^m \lambda_i \alpha_i\right) = \sum_{i=1}^m \lambda_i \varphi(\alpha_i)]
证明(数学归纳法):
- 基例(m=1):(\varphi(\lambda_1 \alpha_1) = \lambda_1 \varphi(\alpha_1)),这是数乘保持性。
- 归纳假设:假设当 (m = k) 时结论成立。
- 归纳步骤(m=k+1):
[
\begin{align}
\varphi\left(\sum_{i=1}^{k+1} \lambda_i \alpha_i\right) &= \varphi\left(\sum_{i=1}^k \lambda_i \alpha_i + \lambda_{k+1} \alpha_{k+1}\right) \
&= \varphi\left(\sum_{i=1}^k \lambda_i \alpha_i\right) + \varphi(\lambda_{k+1} \alpha_{k+1}) \quad \text{(加法保持性)} \
&= \sum_{i=1}^k \lambda_i \varphi(\alpha_i) + \lambda_{k+1} \varphi(\alpha_{k+1}) \quad \text{(归纳假设和数乘保持性)} \
&= \sum_{i=1}^{k+1} \lambda_i \varphi(\alpha_i)
\end{align}
]
由数学归纳法,结论对所有正整数 (m) 成立。□
核心推论:线性映射完全由它在一组基上的取值决定。也就是说,如果两个线性映射在 (V_1) 的一组基上的取值相同,那么它们在整个 (V_1) 上完全相同。这是线性映射矩阵表示的理论基础。
性质3:保持线性相关性(单向性)
结论:若 (\alpha_1, \dots, \alpha_m \in V_1) 线性相关,则 (\varphi(\alpha_1), \dots, \varphi(\alpha_m) \in V_2) 也线性相关。
证明:
若 (\alpha_1, \dots, \alpha_m) 线性相关,则存在不全为零的数 (\lambda_1, \dots, \lambda_m \in F),使得
[\sum_{i=1}^m \lambda_i \alpha_i = 0]
两边同时作用 (\varphi),由性质1和性质2,得
[\sum_{i=1}^m \lambda_i \varphi(\alpha_i) = \varphi\left(\sum_{i=1}^m \lambda_i \alpha_i\right) = \varphi(0) = 0]
因此 (\varphi(\alpha_1), \dots, \varphi(\alpha_m)) 线性相关。□
关键注意事项:逆命题不成立!即线性无关的向量组的像可能线性相关。
- 反例:零映射 (\varphi(\alpha) = 0) 对任意 (\alpha)。任何线性无关的向量组在零映射下的像都是零向量,显然线性相关。
- 几何直观:投影变换会把三维空间中不共线的三个向量(线性无关)投影到平面上,变成共面的三个向量(线性相关)。
二、线性映射的两个核心子空间:核与像
核与像是刻画线性映射结构的两个最基本的工具,它们都是子空间,分别描述了线性映射的"压缩"部分和"有效"部分。
1. 核(Kernel)
定义:线性映射 (\varphi) 的核是所有被映到零向量的向量的集合,记作
[\ker \varphi = { \alpha \in V_1 \mid \varphi(\alpha) = 0 }]
核的维数称为 (\varphi) 的零度(nullity)。
定理:(\ker \varphi) 是 (V_1) 的子空间。
证明:
- 非空性:由性质1,(\varphi(0) = 0),故 (0 \in \ker \varphi)。
- 加法封闭性:若 (\alpha, \beta \in \ker \varphi),则 (\varphi(\alpha) = 0),(\varphi(\beta) = 0),于是
[\varphi(\alpha + \beta) = \varphi(\alpha) + \varphi(\beta) = 0 + 0 = 0]
故 (\alpha + \beta \in \ker \varphi)。 - 数乘封闭性:若 (\alpha \in \ker \varphi),(\lambda \in F),则
[\varphi(\lambda \alpha) = \lambda \varphi(\alpha) = \lambda 0 = 0]
故 (\lambda \alpha \in \ker \varphi)。
因此 (\ker \varphi) 是 (V_1) 的子空间。□
原像的结构:对任意 (\beta \in V_2),若 (\beta) 有原像 (\alpha_0)(即 (\varphi(\alpha_0) = \beta)),则 (\beta) 的所有原像构成的集合为
[\varphi^{-1}(\beta) = \alpha_0 + \ker \varphi = { \alpha_0 + \alpha \mid \alpha \in \ker \varphi }]
这正是非齐次线性方程组解的结构定理的抽象形式:非齐次方程组的通解等于它的一个特解加上对应的齐次方程组的通解。
单射的等价条件:(\varphi) 是单射当且仅当 (\ker \varphi = {0})。
证明:
- 若 (\varphi) 是单射,且 (\alpha \in \ker \varphi),则 (\varphi(\alpha) = 0 = \varphi(0)),由单射性得 (\alpha = 0),故 (\ker \varphi = {0})。
- 若 (\ker \varphi = {0}),且 (\varphi(\alpha_1) = \varphi(\alpha_2)),则 (\varphi(\alpha_1 - \alpha_2) = 0),故 (\alpha_1 - \alpha_2 \in \ker \varphi = {0}),即 (\alpha_1 = \alpha_2),因此 (\varphi) 是单射。□
2. 像(Image)
定义:线性映射 (\varphi) 的像是所有向量的像的集合,记作
[\operatorname{Im} \varphi = \varphi(V_1) = { \varphi(\alpha) \mid \alpha \in V_1 }]
像的维数称为 (\varphi) 的秩(rank)。
定理:(\operatorname{Im} \varphi) 是 (V_2) 的子空间。
证明:
- 非空性:(0 = \varphi(0) \in \operatorname{Im} \varphi)。
- 加法封闭性:若 (\beta_1, \beta_2 \in \operatorname{Im} \varphi),则存在 (\alpha_1, \alpha_2 \in V_1) 使得 (\varphi(\alpha_1) = \beta_1),(\varphi(\alpha_2) = \beta_2),于是
[\beta_1 + \beta_2 = \varphi(\alpha_1) + \varphi(\alpha_2) = \varphi(\alpha_1 + \alpha_2) \in \operatorname{Im} \varphi] - 数乘封闭性:若 (\beta \in \operatorname{Im} \varphi),(\lambda \in F),则存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta),于是
[\lambda \beta = \lambda \varphi(\alpha) = \varphi(\lambda \alpha) \in \operatorname{Im} \varphi]
因此 (\operatorname{Im} \varphi) 是 (V_2) 的子空间。□
像的生成元:若 (\alpha_1, \dots, \alpha_n) 是 (V_1) 的一组基,则
[\operatorname{Im} \varphi = \operatorname{span}{ \varphi(\alpha_1), \dots, \varphi(\alpha_n) }]
因此,线性映射的秩等于它在一组基下的像向量组的秩。
满射的等价条件:(\varphi) 是满射当且仅当 (\operatorname{Im} \varphi = V_2)。
三、线性代数的基本定理:秩-零度定理
这是教材中省略的最核心的定理,它揭示了线性映射的核与像的维数之间的基本关系。
秩-零度定理:设 (V_1) 是有限维线性空间,(\varphi: V_1 \rightarrow V_2) 是线性映射,则
[\dim \ker \varphi + \dim \operatorname{Im} \varphi = \dim V_1]
即:零度 + 秩 = 定义域的维数。
证明:
设 (\dim V_1 = n),(\dim \ker \varphi = k)。取 (\ker \varphi) 的一组基 (\alpha_1, \dots, \alpha_k),将其扩充为 (V_1) 的一组基
[\alpha_1, \dots, \alpha_k, \alpha_{k+1}, \dots, \alpha_n]
我们证明 (\varphi(\alpha_{k+1}), \dots, \varphi(\alpha_n)) 是 (\operatorname{Im} \varphi) 的一组基。
-
生成性:对任意 (\beta \in \operatorname{Im} \varphi),存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta)。设
[\alpha = \sum_{i=1}^n \lambda_i \alpha_i]
则
[\beta = \varphi(\alpha) = \sum_{i=1}^n \lambda_i \varphi(\alpha_i) = \sum_{i=k+1}^n \lambda_i \varphi(\alpha_i)]
因为当 (i \leq k) 时,(\alpha_i \in \ker \varphi),故 (\varphi(\alpha_i) = 0)。因此 (\operatorname{Im} \varphi) 由 (\varphi(\alpha_{k+1}), \dots, \varphi(\alpha_n)) 生成。 -
线性无关性:设存在数 (\lambda_{k+1}, \dots, \lambda_n \in F) 使得
[\sum_{i=k+1}^n \lambda_i \varphi(\alpha_i) = 0]
则
[\varphi\left(\sum_{i=k+1}^n \lambda_i \alpha_i\right) = 0]
故 (\sum_{i=k+1}^n \lambda_i \alpha_i \in \ker \varphi)。因此它可以表示为 (\ker \varphi) 的基的线性组合:
[\sum_{i=k+1}^n \lambda_i \alpha_i = \sum_{i=1}^k \mu_i \alpha_i]
移项得
[\sum_{i=1}^k \mu_i \alpha_i - \sum_{i=k+1}^n \lambda_i \alpha_i = 0]
因为 (\alpha_1, \dots, \alpha_n) 是 (V_1) 的基,线性无关,所以所有系数都为零,即
[\mu_1 = \dots = \mu_k = 0, \quad \lambda_{k+1} = \dots = \lambda_n = 0]
因此 (\varphi(\alpha_{k+1}), \dots, \varphi(\alpha_n)) 线性无关。
综上,(\varphi(\alpha_{k+1}), \dots, \varphi(\alpha_n)) 是 (\operatorname{Im} \varphi) 的一组基,故
[\dim \operatorname{Im} \varphi = n - k = \dim V_1 - \dim \ker \varphi]
即
[\dim \ker \varphi + \dim \operatorname{Im} \varphi = \dim V_1]
□
四、典型例子
例1:矩阵乘法映射
设 (A) 是 (m \times n) 矩阵,(\mathscr{A}(x) = Ax) 是从 (F^{(n)}) 到 (F^{(m)}) 的线性映射,则:
- (\ker \mathscr{A}) 是齐次线性方程组 (Ax = 0) 的解空间,维数为 (n - r(A))
- (\operatorname{Im} \mathscr{A}) 是 (A) 的列空间,维数为 (r(A))
- 秩-零度定理验证:((n - r(A)) + r(A) = n = \dim F^{(n)})
例2:求导变换
设 (\mathcal{D}: F[x]_n \rightarrow F[x]_n) 是求导变换,则:
- (\ker \mathcal{D}) 是常数多项式空间,维数为1
- (\operatorname{Im} \mathcal{D}) 是次数小于 (n-1) 的多项式空间,维数为 (n-1)
- 秩-零度定理验证:(1 + (n-1) = n = \dim F[x]_n)
五、常见易错点总结
- 线性相关性的单向性:线性映射保持线性相关性,但不保持线性无关性。
- 核与像的空间归属:核是定义域的子空间,像是值域的子空间,不要搞反。
- 秩-零度定理的适用范围:仅适用于有限维线性空间,无限维空间中不成立。
- 原像的结构:非齐次方程组的解集是齐次解空间的陪集,不是子空间。
这是线性映射运算理论的基础,它定义了线性映射的复合运算,并证明了线性映射的复合仍然是线性映射。这一结论是线性映射矩阵表示的核心依据——线性映射的复合对应矩阵的乘法,也是整个线性代数中运算体系的关键组成部分。下面我将为你严格证明引理5.3,深入解析复合运算的顺序问题,补充教材省略的基本性质,并建立与矩阵乘法的对应关系。
一、映射复合的定义与核心注意事项
定义5.8:设 (\varphi: S_1 \rightarrow S_2) 和 (\psi: S_2 \rightarrow S_3) 是两个映射,则它们的复合(或乘积)记作 (\psi \circ \varphi)(或简记为 (\psi\varphi)),定义为:
[\psi \circ \varphi: S_1 \rightarrow S_3, \quad (\psi \circ \varphi)(x) = \psi(\varphi(x))]
最容易出错的点:复合顺序
复合运算的顺序是从右到左:
- (\psi \circ \varphi) 表示先执行右边的映射 (\varphi),再执行左边的映射 (\psi)
- 绝对不能搞反顺序!(\psi \circ \varphi) 和 (\varphi \circ \psi) 是完全不同的映射,甚至可能根本没有定义(如果定义域和值域不匹配)。
直观理解:可以把映射想象成函数,复合函数 (f(g(x))) 就是先算 (g(x)),再算 (f(g(x))),对应 (f \circ g),顺序完全一致。
二、引理5.3的严格证明
引理5.3:若 (\varphi: V_1 \rightarrow V_2) 和 (\psi: V_2 \rightarrow V_3) 都是线性映射,则它们的复合 (\psi \circ \varphi: V_1 \rightarrow V_3) 也是线性映射。
证明:我们验证线性映射的两个条件:
-
加法保持性:对任意 (\alpha, \beta \in V_1),有
[
\begin{align}
(\psi \circ \varphi)(\alpha + \beta) &= \psi(\varphi(\alpha + \beta)) \
&= \psi(\varphi(\alpha) + \varphi(\beta)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \psi(\varphi(\alpha)) + \psi(\varphi(\beta)) \quad \text{(因为 (\psi) 是线性映射)} \
&= (\psi \circ \varphi)(\alpha) + (\psi \circ \varphi)(\beta)
\end{align}
] -
数乘保持性:对任意 (\lambda \in F),(\alpha \in V_1),有
[
\begin{align}
(\psi \circ \varphi)(\lambda \alpha) &= \psi(\varphi(\lambda \alpha)) \
&= \psi(\lambda \varphi(\alpha)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \lambda \psi(\varphi(\alpha)) \quad \text{(因为 (\psi) 是线性映射)} \
&= \lambda (\psi \circ \varphi)(\alpha)
\end{align}
]
因此,(\psi \circ \varphi) 满足线性映射的定义,是线性映射。□
三、复合运算的基本性质(教材省略)
1. 结合律
映射的复合满足结合律:若 (\varphi: S_1 \rightarrow S_2),(\psi: S_2 \rightarrow S_3),(\omega: S_3 \rightarrow S_4),则
[\omega \circ (\psi \circ \varphi) = (\omega \circ \psi) \circ \varphi]
因此可以简记为 (\omega \circ \psi \circ \varphi),不需要加括号。
证明:对任意 (x \in S_1),
[
\begin{align}
(\omega \circ (\psi \circ \varphi))(x) &= \omega((\psi \circ \varphi)(x)) = \omega(\psi(\varphi(x))) \
((\omega \circ \psi) \circ \varphi)(x) &= (\omega \circ \psi)(\varphi(x)) = \omega(\psi(\varphi(x)))
\end{align}
]
两边相等,故结合律成立。□
2. 单位元
对任意映射 (\varphi: S \rightarrow T),有
[I_T \circ \varphi = \varphi = \varphi \circ I_S]
其中 (I_S) 和 (I_T) 分别是集合 (S) 和 (T) 上的恒等映射(即 (I(x) = x))。
3. 核与像的包含关系
若 (\varphi: V_1 \rightarrow V_2) 和 (\psi: V_2 \rightarrow V_3) 是线性映射,则:
- (\ker \varphi \subseteq \ker(\psi \circ \varphi))(被 (\varphi) 映到零的向量,一定被复合映射映到零)
- (\operatorname{Im}(\psi \circ \varphi) \subseteq \operatorname{Im} \psi)(复合映射的像一定是 (\psi) 的像的子集)
推论(秩的不等式):
[\operatorname{rank}(\psi \circ \varphi) \leq \min{\operatorname{rank} \varphi, \operatorname{rank} \psi}]
即复合映射的秩不超过任何一个因子映射的秩。
四、核心对应:线性映射的复合与矩阵乘法
这是复合运算最重要的应用,它建立了线性映射运算与矩阵运算之间的桥梁。
定理:设 (V_1, V_2, V_3) 是有限维线性空间,分别取定它们的基。设线性映射 (\varphi: V_1 \rightarrow V_2) 在给定基下的矩阵为 (A),线性映射 (\psi: V_2 \rightarrow V_3) 在给定基下的矩阵为 (B),则复合映射 (\psi \circ \varphi: V_1 \rightarrow V_3) 在给定基下的矩阵为 (BA)。
关键注意事项:矩阵乘法的顺序与映射复合的顺序相反!
- 先做映射 (\varphi)(对应矩阵 (A)),再做映射 (\psi)(对应矩阵 (B)),复合映射对应的矩阵是 (BA),不是 (AB)。
直观解释:向量 (x) 在基下的坐标为列向量 (X),则
- (\varphi(x)) 的坐标为 (AX)
- (\psi(\varphi(x))) 的坐标为 (B(AX) = (BA)X)
因此复合映射对应的矩阵是 (BA)。
五、复合运算的非交换性
极其重要:线性映射的复合一般不满足交换律,即
[\psi \circ \varphi \neq \varphi \circ \psi]
即使两个复合都有定义,它们通常也不相等。
典型反例1:平面几何变换
- 设 (\varphi) 是绕原点旋转90度的变换,(\psi) 是关于x轴的反射变换。
- 先旋转再反射:(\psi \circ \varphi(1,0) = \psi(0,1) = (0,-1))
- 先反射再旋转:(\varphi \circ \psi(1,0) = \varphi(1,0) = (0,1))
显然 (\psi \circ \varphi \neq \varphi \circ \psi)。
典型反例2:求导与积分变换
- 设 (\mathcal{D}: F[x]n \rightarrow F[x]) 是求导变换,(\mathcal{I}: F[x]_{n-1} \rightarrow F[x]_n) 是积分变换。
- 先积分再求导:(\mathcal{D} \circ \mathcal{I} = I)(恒等变换)
- 先求导再积分:(\mathcal{I} \circ \mathcal{D} \neq I)(常数项丢失)
六、特殊映射的复合
- 零映射:对任意线性映射 (\varphi),有 (0 \circ \varphi = 0) 和 (\varphi \circ 0 = 0)。
- 可逆映射:若 (\varphi) 是可逆线性映射,其逆映射为 (\varphi^{-1}),则 (\varphi \circ \varphi^{-1} = I) 且 (\varphi^{-1} \circ \varphi = I)。
- 幂运算:线性变换(到自身的线性映射)可以定义幂运算:
[\varphi^0 = I, \quad \varphi^1 = \varphi, \quad \varphi^2 = \varphi \circ \varphi, \quad \dots, \quad \varphi^k = \varphi \circ \varphi^{k-1}]
幂运算满足指数法则:(\varphi^m \circ \varphi^n = \varphi{m+n}),((\varphim)^n = \varphi^{mn})。
七、常见易错点总结
- 复合顺序搞反:这是最常见的错误,(\psi \circ \varphi) 是先 (\varphi) 后 (\psi),对应矩阵乘法 (BA)。
- 误以为复合满足交换律:绝大多数线性映射的复合都不交换,只有特殊情况(如同一变换的幂)才交换。
- 忽略定义域和值域的匹配:只有当第一个映射的值域包含于第二个映射的定义域时,复合才有定义。
- 矩阵乘法顺序错误:线性映射复合对应的矩阵乘法顺序与映射顺序相反,一定要牢记。
这是线性代数中最具革命性的概念之一,它揭示了所有有限维线性空间的本质统一性:维数相同的线性空间在代数结构上完全相同。同构的引入使得我们可以将任何抽象线性空间的问题转化为熟悉的数组空间 (F^n) 中的问题,从而用矩阵工具统一解决。下面我将为你严格证明所有结论,深入解析同构的本质,补充核心的分类定理,并讲解其理论意义与应用。
一、同构的定义与等价条件
定义5.9:设 (\varphi: V_1 \rightarrow V_2) 是域 (F) 上线性空间之间的线性映射。若 (\varphi) 是双射(既是单射又是满射),则称 (\varphi) 为同构映射,并称 (V_1) 与 (V_2) 是同构的,记作 (V_1 \cong V_2)。
线性空间 (V) 到自身的同构映射称为自同构。
同构的等价判定条件
对于线性映射 (\varphi: V_1 \rightarrow V_2),以下条件等价:
- (\varphi) 是同构映射
- (\varphi) 是双射
- (\ker \varphi = {0}) 且 (\operatorname{Im} \varphi = V_2)(单射且满射)
- 存在线性映射 (\psi: V_2 \rightarrow V_1),使得 (\psi \circ \varphi = I_{V_1}) 且 (\varphi \circ \psi = I_{V_2})(存在逆映射)
证明(4⇒1):若存在这样的 (\psi),则 (\varphi) 是单射(因为若 (\varphi(\alpha_1) = \varphi(\alpha_2)),则 (\alpha_1 = \psi(\varphi(\alpha_1)) = \psi(\varphi(\alpha_2)) = \alpha_2)),且 (\varphi) 是满射(因为对任意 (\beta \in V_2),(\beta = \varphi(\psi(\beta)))),故 (\varphi) 是双射,即同构。□
二、教材例子的深度解析与证明
例5.11:行向量空间与列向量空间同构
映射:(\varphi: F^n \rightarrow F^{(n)}),(\varphi(a_1, \dots, a_n) = (a_1, \dots, a_n)^T)(转置映射)
证明是同构:
- 线性性:(\varphi(\alpha + \beta) = (\alpha + \beta)^T = \alpha^T + \beta^T = \varphi(\alpha) + \varphi(\beta)),(\varphi(\lambda \alpha) = (\lambda \alpha)^T = \lambda \alpha^T = \lambda \varphi(\alpha))。
- 单射性:若 (\varphi(\alpha) = \varphi(\beta)),则 (\alpha^T = \beta^T),故 (\alpha = \beta)。
- 满射性:对任意列向量 ((a_1, \dots, a_n)^T \in F^{(n)}),存在行向量 ((a_1, \dots, a_n) \in F^n) 使得 (\varphi(a_1, \dots, a_n) = (a_1, \dots, a_n)^T)。
因此 (\varphi) 是双射线性映射,即同构。□
例5.12:多项式空间与数组空间同构
映射:(\varphi: F[x]n \rightarrow F^n),(\varphi(a_0 + a_1x + \dots + ax^{n-1}) = (a_0, a_1, \dots, a_{n-1}))(坐标映射)
证明是同构:
- 线性性:多项式的加法对应系数相加,数乘对应系数数乘,显然保持线性运算。
- 单射性:若两个多项式的系数相同,则它们是同一个多项式。
- 满射性:对任意数组 ((a_0, \dots, a_{n-1}) \in F^n),存在多项式 (a_0 + a_1x + \dots + a_{n-1}x^{n-1} \in F[x]_n) 与之对应。
因此 (\varphi) 是同构。□
核心意义:这个例子是所有有限维线性空间的原型。它告诉我们,任何n维线性空间中的元素都可以用一个n元数组来表示,线性运算对应数组的运算。这就是为什么我们可以用矩阵来研究所有有限维线性空间的问题。
例5.13:单射线性映射诱导的同构
结论:若 (\varphi: V_1 \rightarrow V_2) 是单射线性映射,则 (V_1 \cong \operatorname{Im} \varphi)。
严格证明:
考虑映射 (\widetilde{\varphi}: V_1 \rightarrow \operatorname{Im} \varphi),(\widetilde{\varphi}(\alpha) = \varphi(\alpha))。
- 线性性:显然继承自 (\varphi)。
- 单射性:因为 (\varphi) 是单射,所以 (\widetilde{\varphi}) 也是单射。
- 满射性:对任意 (\beta \in \operatorname{Im} \varphi),存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta),即 (\widetilde{\varphi}(\alpha) = \beta)。
因此 (\widetilde{\varphi}) 是双射线性映射,即 (V_1 \cong \operatorname{Im} \varphi)。□
推论:对任意线性映射 (\varphi: V_1 \rightarrow V_2),有 (V_1 / \ker \varphi \cong \operatorname{Im} \varphi)(线性代数基本定理的同构形式)。
三、有限维线性空间的分类定理(核心结论)
这是同构理论最重要的定理,教材中虽未明确写出,但却是整个线性代数的基石。
定理:域 (F) 上两个有限维线性空间同构当且仅当它们的维数相等。
证明:
- 必要性(⇒):若 (V_1 \cong V_2),则存在同构映射 (\varphi: V_1 \rightarrow V_2)。同构映射把基映为基,因此维数相等。
- 充分性(⇐):若 (\dim V_1 = \dim V_2 = n),则 (V_1 \cong F^n) 且 (V_2 \cong F^n),由同构的传递性得 (V_1 \cong V_2)。□
推论:域 (F) 上任意n维线性空间都同构于n元数组空间 (F^n)。
理论意义:这个定理完成了有限维线性空间的完全分类。它告诉我们,维数是有限维线性空间唯一的同构不变量。也就是说,从代数结构的角度看,不存在其他的有限维线性空间,所有n维线性空间都是同一个东西,只是元素的表示形式不同而已。
四、同构的基本性质
- 自反性:(V \cong V)(恒等映射是同构)。
- 对称性:若 (V_1 \cong V_2),则 (V_2 \cong V_1)(同构映射的逆映射也是同构)。
- 传递性:若 (V_1 \cong V_2) 且 (V_2 \cong V_3),则 (V_1 \cong V_3)(同构映射的复合也是同构)。
因此,同构关系是线性空间之间的等价关系,它将所有线性空间分成了互不相交的等价类,每个等价类中的空间具有相同的维数。
五、同构保持的线性性质
同构映射保持所有线性性质,也就是说,两个同构的线性空间在所有线性代数性质上完全相同。具体来说:
- 同构映射把线性相关的向量组映为线性相关的向量组,把线性无关的向量组映为线性无关的向量组。
- 同构映射把基映为基。
- 同构映射把子空间映为子空间,且保持子空间的维数。
- 同构映射保持线性映射的核与像的维数。
六、常见易错点总结
- 混淆同构与相等:同构的空间只是代数结构相同,元素本身可以完全不同。例如,多项式空间 (F[x]_n) 和数组空间 (F^n) 同构,但它们的元素一个是多项式,一个是数组,显然不相等。
- 忽略基域:同构是相对于同一个基域而言的。例如,(\mathbb{C}) 作为 (\mathbb{R}) 上的线性空间是2维的,与 (\mathbb{R}^2) 同构;但作为 (\mathbb{C}) 上的线性空间是1维的,与 (\mathbb{C}) 自身同构。
- 无限维空间的情况:分类定理仅适用于有限维空间。对于无限维空间,维数相等(基数相等)是同构的必要条件,但不是充分条件。
- 自同构的多样性:一个线性空间可以有很多不同的自同构。例如,(\mathbb{R}^2) 上的所有可逆线性变换都是自同构,它们构成了一般线性群 (GL_2(\mathbb{R}))。
七、理论意义与应用
同构概念的引入是线性代数发展史上的里程碑,它的意义在于:
- 统一了研究对象:将所有有限维线性空间的研究统一到 (F^n) 的研究上,大大简化了理论体系。
- 提供了转化方法:任何抽象线性空间的问题都可以通过坐标映射转化为 (F^n) 中的矩阵问题,从而用我们熟悉的矩阵工具来解决。
- 揭示了代数结构的本质:同构概念告诉我们,数学中重要的不是元素本身是什么,而是元素之间的运算关系。这一思想后来被推广到整个抽象代数领域。
这是同构理论的核心定理,它揭示了同构映射最本质的性质:双向保持线性相关性。这是同构映射与一般线性映射的根本区别,也是"同构的线性空间代数结构完全相同"这一结论的理论基础。下面我将为你拆解证明的每一步逻辑,对比一般线性映射的差异,补充教材省略的等价表述和重要推论,并深入解析其理论意义。
一、定理完整表述与核心解读
定理5.1:设 (\varphi: V_1 \xrightarrow{\cong} V_2) 是线性空间的同构映射,(\alpha_1, \dots, \alpha_s) 是 (V_1) 中任意向量组,则
[\varphi(\alpha_1), \dots, \varphi(\alpha_s) \text{ 线性相关} \iff \alpha_1, \dots, \alpha_s \text{ 线性相关}]
核心含义:同构映射是双向保持线性相关性的。也就是说,向量组的线性相关性是同构不变量,不会因为同构映射而改变。
二、证明逻辑的详细拆解
教材中的证明分为正向和反向两部分,下面我们逐句解析其逻辑:
1. 正向证明(⇒):线性映射的共性
命题:若 (\alpha_1, \dots, \alpha_s) 线性相关,则 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 线性相关。
证明逻辑:
- 若 (\alpha_1, \dots, \alpha_s) 线性相关,则存在不全为零的数 (\lambda_1, \dots, \lambda_s \in F),使得
[\sum_{i=1}^s \lambda_i \alpha_i = 0] - 两边同时作用线性映射 (\varphi),由线性映射保持线性组合的性质,得
[\varphi\left(\sum_{i=1}^s \lambda_i \alpha_i\right) = \sum_{i=1}^s \lambda_i \varphi(\alpha_i) = \varphi(0) = 0] - 因为 (\lambda_1, \dots, \lambda_s) 不全为零,所以 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 线性相关。
关键说明:这一性质是所有线性映射都具有的共性,我们之前在"线性映射的基本性质"中已经证明过。它只需要线性性,不需要单射或满射。
2. 反向证明(⇐):同构映射的特性
命题:若 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 线性相关,则 (\alpha_1, \dots, \alpha_s) 线性相关。
证明逻辑:
- 若 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 线性相关,则存在不全为零的数 (\lambda_1, \dots, \lambda_s \in F),使得
[\sum_{i=1}^s \lambda_i \varphi(\alpha_i) = 0] - 由线性映射保持线性组合的性质,左边可以改写为
[\varphi\left(\sum_{i=1}^s \lambda_i \alpha_i\right) = 0] - 最关键的一步:因为 (\varphi) 是同构映射,所以它是单射。而单射的等价条件是 (\ker \varphi = {0}),即只有零向量被映到零向量。因此
[\sum_{i=1}^s \lambda_i \alpha_i = 0] - 因为 (\lambda_1, \dots, \lambda_s) 不全为零,所以 (\alpha_1, \dots, \alpha_s) 线性相关。
核心区别:反向证明必须用到单射性,这是一般线性映射不具备的性质。一般线性映射的核可能非零,因此即使 (\varphi(\sum \lambda_i \alpha_i) = 0),也不能推出 (\sum \lambda_i \alpha_i = 0)。
三、等价表述:保持线性无关性
由定理5.1可以直接推出一个更常用的等价表述:
同构映射保持线性无关性,即
[\varphi(\alpha_1), \dots, \varphi(\alpha_s) \text{ 线性无关} \iff \alpha_1, \dots, \alpha_s \text{ 线性无关}]
证明:线性无关是线性相关的否定,因此双向保持线性相关性等价于双向保持线性无关性。
四、与一般线性映射的本质区别
我们用表格清晰对比不同类型线性映射对线性相关性的保持能力:
| 映射类型 | 正向保持线性相关性 | 反向保持线性相关性 | 保持线性无关性 |
|---|---|---|---|
| 任意线性映射 | ✅ | ❌ | ❌ |
| 单射线性映射 | ✅ | ✅ | ✅ |
| 满射线性映射 | ✅ | ❌ | ❌ |
| 同构映射(双射) | ✅ | ✅ | ✅ |
关键结论:单射性是反向保持线性相关性的充要条件。满射性不影响线性相关性的保持,它只影响生成性的保持。
反例说明:
- 零映射:把所有向量都映到零向量,任何线性无关的向量组的像都是线性相关的。
- 投影映射:(\pi: \mathbb{R}^3 \rightarrow \mathbb{R}^2),(\pi(x,y,z) = (x,y))。向量组 ((1,0,0), (0,1,0), (0,0,1)) 线性无关,但它们的像 ((1,0), (0,1), (0,0)) 线性相关。
五、重要推论
由定理5.1可以推出一系列关于同构映射的基本性质:
推论1:同构映射把基映为基
设 (\varphi: V_1 \xrightarrow{\cong} V_2) 是同构映射,(\alpha_1, \dots, \alpha_n) 是 (V_1) 的一组基,则 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 是 (V_2) 的一组基。
证明:
- 由定理5.1,(\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 线性无关。
- 因为 (\varphi) 是满射,对任意 (\beta \in V_2),存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta)。设 (\alpha = \sum_{i=1}^n \lambda_i \alpha_i),则 (\beta = \sum_{i=1}^n \lambda_i \varphi(\alpha_i)),即 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 生成 (V_2)。
因此它们是 (V_2) 的一组基。□
推论2:同构的线性空间维数相等
若 (V_1 \cong V_2),则 (\dim V_1 = \dim V_2)。
证明:由推论1,同构映射把基映为基,基中向量的个数就是维数,因此维数相等。□
推论3:同构保持子空间的维数
设 (\varphi: V_1 \xrightarrow{\cong} V_2) 是同构映射,(W) 是 (V_1) 的子空间,则 (\varphi(W)) 是 (V_2) 的子空间,且 (\dim \varphi(W) = \dim W)。
证明:取 (W) 的一组基 (\alpha_1, \dots, \alpha_k),则 (\varphi(\alpha_1), \dots, \varphi(\alpha_k)) 是 (\varphi(W)) 的一组基,故维数相等。□
六、常见易错点总结
- 混淆单射与同构的作用:反向保持线性相关性只需要单射,不需要满射。满射的作用是保证生成性的保持。
- 误以为一般线性映射保持线性无关性:这是最常见的错误,只有单射线性映射才保持线性无关性。
- 忽略核的作用:一般线性映射不能反向保持线性相关性的根本原因是核非零,存在非零向量被映到零向量。
- 无限维空间的推广:定理5.1在无限维空间中仍然成立,因为它只用到了线性性和单射性,与维数是否有限无关。
七、理论意义
定理5.1是同构理论的基石,它的意义在于:
- 解释了同构的本质:同构映射不仅保持线性运算,还保持所有由线性运算衍生出来的性质,包括线性相关性、基、维数、子空间结构等。
- 奠定了分类定理的基础:结合推论2和之前的结论,我们得到"有限维线性空间同构当且仅当维数相等"的分类定理。
- 提供了转化问题的依据:因为同构保持所有线性性质,所以我们可以将任何抽象线性空间的问题通过同构映射转化为熟悉的数组空间 (F^n) 中的问题,用矩阵工具统一解决。
这是定理5.1的两个核心推论,是同构理论中最具实用价值的结论。它们清晰地展示了同构映射如何保持线性空间的核心结构——基和维数。教材中仅证明了第(1)点,下面我将为你补全第(2)点的严格证明,深入拆解单射与满射在证明中的不同作用,补充逆命题的讨论,并讲解这些结论在实际证明中的应用技巧。
一、推论完整表述与证明补全
推论:设 (\varphi: V_1 \rightarrow V_2) 是线性空间的同构映射,则:
- 若 (\alpha_1, \dots, \alpha_n) 是 (V_1) 的基,则 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 是 (V_2) 的基。
- (\dim V_1 = \dim V_2)。
1. 第(1)点证明的逻辑拆解
教材中的证明分为两步,分别对应同构的两个性质:
- 线性无关性:由单射性保证(定理5.1)。因为 (\alpha_1, \dots, \alpha_n) 线性无关,所以它们的像 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 也线性无关。
- 生成性:由满射性保证。因为 (\varphi) 是满射,对任意 (\beta \in V_2),存在原像 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta)。而 (\alpha) 可以表示为 (V_1) 基的线性组合,因此 (\beta) 可以表示为像向量组的线性组合。
关键洞察:基的两个条件(线性无关、生成空间)分别对应同构的两个条件(单射、满射)。这揭示了同构的本质:单射保持线性无关性,满射保持生成性。
2. 第(2)点的严格证明(教材省略)
证明:
因为 (V_1) 是线性空间,所以它存在一组基 (\alpha_1, \dots, \alpha_n),故 (\dim V_1 = n)。
由推论(1),(\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 是 (V_2) 的一组基,因此 (\dim V_2 = n)。
故 (\dim V_1 = \dim V_2)。□
二、单射与满射的作用分离
为了更深刻地理解同构的性质,我们将单射和满射的作用分离开来,看看它们各自能保持什么:
| 映射性质 | 保持的结构 | 结论 |
|---|---|---|
| 单射线性映射 | 线性无关性 | 把线性无关的向量组映为线性无关的向量组 |
| 满射线性映射 | 生成性 | 把生成空间的向量组映为生成空间的向量组 |
| 同构映射(双射) | 基 | 把基映为基 |
定理(生成性的保持):设 (\varphi: V_1 \rightarrow V_2) 是满射线性映射,若 (\alpha_1, \dots, \alpha_s) 生成 (V_1),则 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 生成 (V_2)。
证明:对任意 (\beta \in V_2),因为 (\varphi) 是满射,存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta)。因为 (\alpha_1, \dots, \alpha_s) 生成 (V_1),所以 (\alpha = \sum_{i=1}^s \lambda_i \alpha_i),故 (\beta = \sum_{i=1}^s \lambda_i \varphi(\alpha_i))。因此 (\varphi(\alpha_1), \dots, \varphi(\alpha_s)) 生成 (V_2)。□
三、逆命题的讨论
这两个推论的逆命题都是成立的,它们构成了有限维线性空间分类定理的核心。
逆命题1:把基映为基的线性映射是同构
定理:设 (\varphi: V_1 \rightarrow V_2) 是线性映射,若存在 (V_1) 的一组基 (\alpha_1, \dots, \alpha_n),使得 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 是 (V_2) 的一组基,则 (\varphi) 是同构映射。
证明:
- 单射性:因为 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 线性无关,所以 (\ker \varphi = {0})(若 (\varphi(\alpha) = 0),设 (\alpha = \sum \lambda_i \alpha_i),则 (\sum \lambda_i \varphi(\alpha_i) = 0),故所有 (\lambda_i = 0),即 (\alpha = 0))。
- 满射性:因为 (\varphi(\alpha_1), \dots, \varphi(\alpha_n)) 生成 (V_2),所以 (\operatorname{Im} \varphi = V_2)。
因此 (\varphi) 是双射线性映射,即同构。□
逆命题2:维数相等的有限维线性空间同构
定理:设 (V_1) 和 (V_2) 是域 (F) 上的有限维线性空间,若 (\dim V_1 = \dim V_2),则 (V_1 \cong V_2)。
证明:
设 (\dim V_1 = \dim V_2 = n)。取 (V_1) 的一组基 (\alpha_1, \dots, \alpha_n),取 (V_2) 的一组基 (\beta_1, \dots, \beta_n)。定义线性映射 (\varphi: V_1 \rightarrow V_2) 为
[\varphi\left(\sum_{i=1}^n \lambda_i \alpha_i\right) = \sum_{i=1}^n \lambda_i \beta_i]
则 (\varphi) 是线性映射,且把 (V_1) 的基映为 (V_2) 的基。由逆命题1,(\varphi) 是同构映射,故 (V_1 \cong V_2)。□
核心结论:域 (F) 上的有限维线性空间在同构意义下完全由维数决定。所有n维线性空间都同构于n元数组空间 (F^n)。
四、典型应用场景与证明技巧
这两个推论是证明线性空间同构和线性映射是同构的最常用工具。
技巧1:证明两个有限维空间同构
方法:只需证明它们的维数相等。
例题:证明 (M_{m \times n}(F) \cong F^{mn})。
证明:(\dim M_{m \times n}(F) = mn),(\dim F^{mn} = mn),由逆命题2,(M_{m \times n}(F) \cong F^{mn})。□
技巧2:证明一个线性映射是同构
方法:只需证明它把一组基映为一组基。
例题:设 (V) 是n维线性空间,(\alpha_1, \dots, \alpha_n) 是 (V) 的一组基,(\beta_1, \dots, \beta_n) 是 (V) 中任意n个线性无关的向量。证明存在唯一的自同构 (\varphi) 使得 (\varphi(\alpha_i) = \beta_i) 对所有 (i) 成立。
证明:
- 存在性:定义线性映射 (\varphi) 为 (\varphi(\sum \lambda_i \alpha_i) = \sum \lambda_i \beta_i)。因为 (\beta_1, \dots, \beta_n) 线性无关,所以它们是 (V) 的一组基。由逆命题1,(\varphi) 是自同构。
- 唯一性:若有另一个自同构 (\psi) 满足 (\psi(\alpha_i) = \beta_i),则 (\varphi) 和 (\psi) 在一组基上取值相同,因此在整个空间上相同。□
五、常见易错点总结
- 混淆单射和满射的作用:单射保持线性无关性,满射保持生成性,不要搞反。
- 忽略有限维条件:逆命题2(维数相等则同构)仅适用于有限维空间,无限维空间不成立。
- 基的顺序:同构映射保持基的顺序,基的顺序改变会导致同构映射改变。
- 唯一性:两个同构的空间之间可以有很多不同的同构映射,不是唯一的。
六、理论意义
这两个推论及其逆命题构成了有限维线性空间的完整分类理论。它们告诉我们:
- 维数是有限维线性空间唯一的同构不变量。
- 所有有限维线性空间的问题都可以转化为数组空间 (F^n) 中的问题。
- 线性映射的性质完全由它在一组基上的取值决定。
这是同构关系的基本运算性质引理,它证明了同构映射的逆映射和复合映射仍然是同构映射。这一结论是"同构是线性空间之间的等价关系"的核心依据,也是我们能够对线性空间进行同构分类的理论基础。下面我将为你补全教材中省略的复合映射证明,深入解析证明中的关键技巧,并讲解这一引理的理论意义。
一、引理完整表述
引理5.4:
- 若 (\varphi: V_1 \rightarrow V_2) 是线性空间的同构映射,则其逆映射 (\varphi^{-1}: V_2 \rightarrow V_1) 也是同构映射。
- 若 (\varphi: V_1 \rightarrow V_2) 和 (\psi: V_2 \rightarrow V_3) 都是线性空间的同构映射,则它们的复合映射 (\psi \circ \varphi: V_1 \rightarrow V_3) 也是同构映射。
二、完整证明与逻辑拆解
1. 逆映射是同构的证明
证明思路:要证明一个映射是同构,需要证明两点:(1) 它是双射;(2) 它是线性映射。
第一步:证明 (\varphi^{-1}) 是双射
这是集合论的基本结论:双射的逆映射仍然是双射。
- 单射性:若 (\varphi^{-1}(\beta_1) = \varphi^{-1}(\beta_2)),则两边同时作用 (\varphi),得 (\beta_1 = \beta_2)。
- 满射性:对任意 (\alpha \in V_1),存在 (\beta = \varphi(\alpha) \in V_2),使得 (\varphi^{-1}(\beta) = \alpha)。
因此 (\varphi^{-1}) 是双射。
第二步:证明 (\varphi^{-1}) 是线性映射
这是证明的核心部分,教材中使用了一个非常巧妙的技巧:利用 (\varphi) 的满射性,将 (V_2) 中的任意向量表示为 (\varphi(\alpha)) 的形式。
对任意 (\beta_1, \beta_2 \in V_2),因为 (\varphi) 是满射,所以存在 (\alpha_1, \alpha_2 \in V_1) 使得 (\varphi(\alpha_1) = \beta_1),(\varphi(\alpha_2) = \beta_2)。
- 加法保持性:
[
\begin{align}
\varphi^{-1}(\beta_1 + \beta_2) &= \varphi^{-1}(\varphi(\alpha_1) + \varphi(\alpha_2)) \
&= \varphi^{-1}(\varphi(\alpha_1 + \alpha_2)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \alpha_1 + \alpha_2 \quad \text{(逆映射的定义)} \
&= \varphi^{-1}(\beta_1) + \varphi^{-1}(\beta_2)
\end{align}
] - 数乘保持性:对任意 (\lambda \in F),
[
\begin{align}
\varphi^{-1}(\lambda \beta_1) &= \varphi^{-1}(\lambda \varphi(\alpha_1)) \
&= \varphi^{-1}(\varphi(\lambda \alpha_1)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \lambda \alpha_1 \quad \text{(逆映射的定义)} \
&= \lambda \varphi^{-1}(\beta_1)
\end{align}
]
因此 (\varphi^{-1}) 是线性映射。
综上,(\varphi^{-1}) 是双射线性映射,即同构映射。□
2. 复合映射是同构的证明(教材省略)
证明思路:同样需要证明复合映射是双射且是线性映射。
第一步:证明 (\psi \circ \varphi) 是双射
这也是集合论的基本结论:两个双射的复合仍然是双射。
- 单射性:若 ((\psi \circ \varphi)(\alpha_1) = (\psi \circ \varphi)(\alpha_2)),则 (\psi(\varphi(\alpha_1)) = \psi(\varphi(\alpha_2)))。因为 (\psi) 是单射,所以 (\varphi(\alpha_1) = \varphi(\alpha_2))。又因为 (\varphi) 是单射,所以 (\alpha_1 = \alpha_2)。
- 满射性:对任意 (\gamma \in V_3),因为 (\psi) 是满射,存在 (\beta \in V_2) 使得 (\psi(\beta) = \gamma)。又因为 (\varphi) 是满射,存在 (\alpha \in V_1) 使得 (\varphi(\alpha) = \beta)。因此 ((\psi \circ \varphi)(\alpha) = \psi(\varphi(\alpha)) = \psi(\beta) = \gamma)。
因此 (\psi \circ \varphi) 是双射。
第二步:证明 (\psi \circ \varphi) 是线性映射
对任意 (\alpha_1, \alpha_2 \in V_1),(\lambda \in F):
- 加法保持性:
[
\begin{align}
(\psi \circ \varphi)(\alpha_1 + \alpha_2) &= \psi(\varphi(\alpha_1 + \alpha_2)) \
&= \psi(\varphi(\alpha_1) + \varphi(\alpha_2)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \psi(\varphi(\alpha_1)) + \psi(\varphi(\alpha_2)) \quad \text{(因为 (\psi) 是线性映射)} \
&= (\psi \circ \varphi)(\alpha_1) + (\psi \circ \varphi)(\alpha_2)
\end{align}
] - 数乘保持性:
[
\begin{align}
(\psi \circ \varphi)(\lambda \alpha_1) &= \psi(\varphi(\lambda \alpha_1)) \
&= \psi(\lambda \varphi(\alpha_1)) \quad \text{(因为 (\varphi) 是线性映射)} \
&= \lambda \psi(\varphi(\alpha_1)) \quad \text{(因为 (\psi) 是线性映射)} \
&= \lambda (\psi \circ \varphi)(\alpha_1)
\end{align}
]
因此 (\psi \circ \varphi) 是线性映射。
综上,(\psi \circ \varphi) 是双射线性映射,即同构映射。□
三、核心结论:同构是等价关系
引理5.4结合恒等映射是同构这一显然事实,证明了同构关系是线性空间之间的等价关系。等价关系满足以下三条性质:
- 自反性:(V \cong V)(恒等映射 (I: V \rightarrow V) 是同构)。
- 对称性:若 (V_1 \cong V_2),则 (V_2 \cong V_1)(由引理5.4第1条,逆映射是同构)。
- 传递性:若 (V_1 \cong V_2) 且 (V_2 \cong V_3),则 (V_1 \cong V_3)(由引理5.4第2条,复合映射是同构)。
理论意义:等价关系可以将集合中的元素分成互不相交的等价类,同一等价类中的元素具有相同的性质。对于线性空间来说,同一等价类中的空间在代数结构上完全相同,这就是我们能够对线性空间进行同构分类的理论基础。
四、常见易错点与注意事项
- 逆映射的线性性不是显然的:一般来说,双射不一定是线性映射,因此必须证明逆映射的线性性。这是很多学生容易忽略的点。
- 复合映射的顺序:复合映射 (\psi \circ \varphi) 是先 (\varphi) 后 (\psi),顺序不能搞反。
- 无限维空间的适用性:引理5.4在无限维空间中仍然成立,因为它只用到了线性性和双射性,与维数是否有限无关。
- 同构的唯一性:两个同构的空间之间可以有很多不同的同构映射,不是唯一的。
五、典型应用
例1:坐标映射的逆映射
设 (B = {\alpha_1, \dots, \alpha_n}) 是 (V) 的一组基,坐标映射 (\varphi_B: V \rightarrow F^n) 是同构映射。根据引理5.4,其逆映射 (\varphi_B^{-1}: F^n \rightarrow V) 也是同构映射,它将数组 ((a_1, \dots, a_n)^T) 映为向量 (a_1\alpha_1 + \dots + a_n\alpha_n)。
例2:基变换的过渡矩阵
设 (B_1) 和 (B_2) 是 (V) 的两组基,(\varphi_1: V \rightarrow F^n) 和 (\varphi_2: V \rightarrow F^n) 分别是对应的坐标映射。则基变换映射 (\varphi_2 \circ \varphi_1^{-1}: F^n \rightarrow F^n) 是同构映射,它对应的矩阵就是从基 (B_1) 到基 (B_2) 的过渡矩阵。
六、后续课程衔接
引理5.4是后续所有同构相关证明的基础,在以下内容中会反复用到:
- 线性变换的相似性:线性变换在不同基下的矩阵相似,其证明依赖于过渡矩阵是可逆矩阵(即同构映射的矩阵表示)。
- 对偶空间:有限维线性空间与其对偶空间同构,与其双对偶空间自然同构。
- 张量积:张量积空间的同构性质。
这是整个线性代数的基石性定理,被称为有限维线性空间的分类定理。它彻底解决了有限维线性空间的结构问题,告诉我们:维数是有限维线性空间唯一的本质特征。教材中的证明非常简洁,下面我将为你逐句拆解证明过程,补充所有“显然”背后的严格逻辑,并深入解析这个定理的革命性意义。
一、定理完整表述
定理5.2:
- 域 (F) 上任意 (n) 维线性空间 (V) 均同构于 (F) 上的 (n) 元行向量空间 (F^n)。
- 域 (F) 上两个有限维线性空间同构当且仅当它们的维数相等。
二、第一部分证明:(V \cong F^n)
1. 构造坐标映射
取定 (V) 的一组基 (\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n)。根据基的定义,对任意向量 (\alpha \in V),存在唯一的一组数 (a_1, a_2, \dots, a_n \in F),使得
[\alpha = a_1\varepsilon_1 + a_2\varepsilon_2 + \dots + a_n\varepsilon_n]
这组数 ((a_1, a_2, \dots, a_n)) 称为向量 (\alpha) 在基 (\varepsilon_1, \dots, \varepsilon_n) 下的坐标。
定义坐标映射:
[\varphi: V \rightarrow F^n, \quad \varphi(a_1\varepsilon_1 + \dots + a_n\varepsilon_n) = (a_1, \dots, a_n)]
2. 严格证明 (\varphi) 是同构映射
教材中说“显然 (\varphi) 是同构”,但我们需要验证同构的三个条件:线性性、单射性、满射性。
(1) 证明线性性
对任意 (\alpha, \beta \in V),(\lambda \in F),设
[\alpha = a_1\varepsilon_1 + \dots + a_n\varepsilon_n, \quad \beta = b_1\varepsilon_1 + \dots + b_n\varepsilon_n]
则
- 加法保持性:
[
\begin{align}
\varphi(\alpha + \beta) &= \varphi((a_1+b_1)\varepsilon_1 + \dots + (a_n+b_n)\varepsilon_n) \
&= (a_1+b_1, \dots, a_n+b_n) \
&= (a_1, \dots, a_n) + (b_1, \dots, b_n) \
&= \varphi(\alpha) + \varphi(\beta)
\end{align}
] - 数乘保持性:
[
\begin{align}
\varphi(\lambda \alpha) &= \varphi(\lambda a_1\varepsilon_1 + \dots + \lambda a_n\varepsilon_n) \
&= (\lambda a_1, \dots, \lambda a_n) \
&= \lambda (a_1, \dots, a_n) \
&= \lambda \varphi(\alpha)
\end{align}
]
因此 (\varphi) 是线性映射。
(2) 证明单射性
单射等价于 (\ker \varphi = {0})。
若 (\varphi(\alpha) = 0)(零向量),则 (\alpha) 的坐标全为0,即
[\alpha = 0 \cdot \varepsilon_1 + \dots + 0 \cdot \varepsilon_n = 0]
故 (\ker \varphi = {0}),(\varphi) 是单射。
关键依据:基的线性组合表示的唯一性。如果表示不唯一,坐标映射就不是良定义的,更不可能是单射。
(3) 证明满射性
对任意行向量 ((a_1, \dots, a_n) \in F^n),定义向量
[\alpha = a_1\varepsilon_1 + \dots + a_n\varepsilon_n \in V]
则 (\varphi(\alpha) = (a_1, \dots, a_n))。因此对任意 (F^n) 中的元素,都存在原像,故 (\varphi) 是满射。
关键依据:基可以线性组合出 (V) 中的所有向量。
第一部分结论
(\varphi) 是双射线性映射,即同构映射,因此
[V \cong F^n]
三、第二部分证明:同构当且仅当维数相等
这是第一部分的直接推论,分为必要性和充分性两个方向。
1. 必要性(⇒):同构 ⇒ 维数相等
若 (V_1 \cong V_2),则存在同构映射 (\varphi: V_1 \rightarrow V_2)。根据之前的推论,同构映射把基映为基,因此
[\dim V_1 = \dim V_2]
2. 充分性(⇐):维数相等 ⇒ 同构
若 (\dim V_1 = \dim V_2 = n),则由第一部分结论:
[V_1 \cong F^n, \quad V_2 \cong F^n]
根据同构的对称性((F^n \cong V_2))和传递性((V_1 \cong F^n \cong V_2)),得
[V_1 \cong V_2]
四、定理的革命性意义
这个定理是线性代数发展史上的里程碑,它的意义怎么强调都不为过:
1. 完成了有限维线性空间的完全分类
它告诉我们:从代数结构的角度看,不存在其他的有限维线性空间。所有域 (F) 上的n维线性空间,无论它的元素是多项式、矩阵、函数还是其他任何东西,都和数组空间 (F^n) 完全一样。
2. 建立了抽象与具体的桥梁
它提供了一个通用的转化方法:
任何抽象n维线性空间中的问题,都可以通过取定一组基,转化为我们熟悉的数组空间 (F^n) 中的问题,用矩阵和向量的工具来解决。
这就是为什么矩阵在线性代数中处于核心地位——它是所有有限维线性映射的通用表示形式。
3. 揭示了维数的本质
维数不是一个简单的数字,它是有限维线性空间唯一的同构不变量。两个有限维线性空间是否“一样”,只需要看它们的维数是否相等。
五、典型例子与应用
例1:多项式空间
次数小于n的多项式空间 (F[x]n) 是n维线性空间,基为 ({1, x, x^2, \dots, x^{n-1}})。根据定理5.2,
[F[x]n \cong F^n]
同构映射就是把多项式映到它的系数向量:
[\varphi(a_0 + a_1x + \dots + ax^{n-1}) = (a_0, a_1, \dots, a)]
例2:矩阵空间
m×n矩阵空间 (M_{m \times n}(F)) 是mn维线性空间,基为矩阵单位组 ({E_{ij}})。根据定理5.2,
[M_{m \times n}(F) \cong F^{mn}]
同构映射就是把矩阵按行(或列)展开成一个长向量。
例3:复数空间
复数域 (\mathbb{C}) 作为实数域 (\mathbb{R}) 上的线性空间是2维的,基为 ({1, i})。根据定理5.2,
[\mathbb{C} \cong \mathbb{R}^2]
同构映射就是把复数映到它的实部和虚部:
[\varphi(a + bi) = (a, b)]
六、常见误区与注意事项
- 仅适用于有限维空间:这个定理对无限维空间不成立。例如,全体多项式空间 (F[x]) 和全体连续函数空间 (C[a,b]) 都是无限维的,但它们不同构。
- 同构≠相等:同构的空间只是代数结构相同,元素本身可以完全不同。例如,多项式和数组显然不是同一个东西,但它们的线性运算性质完全一样。
- 坐标映射依赖于基:不同的基对应不同的坐标映射,但无论用哪个基,(V) 都同构于 (F^n)。
- 基域的重要性:同构是相对于同一个基域而言的。例如,(\mathbb{C}) 作为 (\mathbb{R}) 上的空间是2维的,与 (\mathbb{R}^2) 同构;但作为 (\mathbb{C}) 上的空间是1维的,与 (\mathbb{C}) 自身同构。
七、定理的后续影响
定理5.2是整个线性代数理论体系的核心,后续几乎所有内容都建立在它的基础上:
- 线性映射的矩阵表示:正是因为 (V \cong F^n),(W \cong F^m),所以线性映射 (\varphi: V \rightarrow W) 可以表示为一个m×n矩阵。
- 线性方程组的理论:齐次线性方程组的解空间是 (F^n) 的子空间,其维数为 (n - r(A))。
- 特征值与特征向量:线性变换的特征值问题可以转化为矩阵的特征值问题。
---这是线性代数中最实用的核心工具之一,它解决了"同一个向量在不同基下坐标如何转换"的问题,是后续线性变换矩阵表示、相似矩阵等内容的基础。这部分内容的最大难点是容易搞混过渡矩阵的方向和坐标变换的顺序,下面我将为你逐句拆解公式推导,用直观例子澄清所有混淆点,并总结出永不记错的记忆方法。
一、基变换与过渡矩阵
1. 问题的提出
线性空间的基不是唯一的。设 (V) 是域 (F) 上的 (n) 维线性空间,我们有两组基:
- 旧基:(\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n)
- 新基:(\eta_1, \eta_2, \dots, \eta_n)
因为旧基是 (V) 的一组基,所以每个新基向量都可以唯一地表示为旧基的线性组合。
2. 基变换公式
将每个新基向量用旧基线性表出:
[
\begin{cases}
\eta_1 = a_{11}\varepsilon_1 + a_{21}\varepsilon_2 + \dots + a_{n1}\varepsilon_n \
\eta_2 = a_{12}\varepsilon_1 + a_{22}\varepsilon_2 + \dots + a_{n2}\varepsilon_n \
\quad \vdots \
\eta_n = a_{1n}\varepsilon_1 + a_{2n}\varepsilon_2 + \dots + a_{nn}\varepsilon_n
\end{cases}
]
为了书写简洁,我们引入形式矩阵乘法(把向量当作矩阵的元素进行乘法运算),将上述方程组写成矩阵形式:
[
(\eta_1, \eta_2, \dots, \eta_n) = (\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n) A
]
其中 (A = (a_{ij})_{n \times n}) 是一个 (n) 阶方阵,称为由旧基 (\varepsilon_1, \dots, \varepsilon_n) 到新基 (\eta_1, \dots, \eta_n) 的过渡矩阵。
3. 过渡矩阵的核心性质
性质1:过渡矩阵的第 (j) 列是新基向量 (\eta_j) 在旧基下的坐标列
这是过渡矩阵最本质的性质,也是教材注记1强调的内容。
- 第1列:((a_{11}, a_{21}, \dots, a_{n1})^T) 是 (\eta_1) 在旧基下的坐标
- 第2列:((a_{12}, a_{22}, \dots, a_{n2})^T) 是 (\eta_2) 在旧基下的坐标
- ...
- 第 (j) 列:((a_{1j}, a_{2j}, \dots, a_{nj})^T) 是 (\eta_j) 在旧基下的坐标
记忆口诀:新基用旧基表,A的列是新基在旧基下的坐标
性质2:过渡矩阵是可逆矩阵
证明:因为 (\eta_1, \dots, \eta_n) 是基,所以它们线性无关。根据定理5.2(同构映射保持线性无关性),它们在旧基下的坐标列也线性无关。而过渡矩阵 (A) 的列向量就是这些坐标列,因此 (A) 的列向量线性无关,故 (A) 可逆,即 (\det A \neq 0)。
推论:由新基到旧基的过渡矩阵是 (A^{-1})
[
(\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n) = (\eta_1, \eta_2, \dots, \eta_n) A^{-1}
]
二、坐标变换公式
现在我们来解决核心问题:同一个向量在不同基下的坐标有什么关系?
1. 向量的两种表示
设向量 (\alpha \in V),它在旧基下的坐标为 (x = (x_1, x_2, \dots, x_n)^T),在新基下的坐标为 (y = (y_1, y_2, \dots, y_n)^T)。根据坐标的定义:
[
\alpha = (\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n) \begin{pmatrix} x_1 \ x_2 \ \vdots \ x_n \end{pmatrix} = (\eta_1, \eta_2, \dots, \eta_n) \begin{pmatrix} y_1 \ y_2 \ \vdots \ y_n \end{pmatrix}
]
2. 公式推导
将基变换公式 ((\eta_1, \dots, \eta_n) = (\varepsilon_1, \dots, \varepsilon_n) A) 代入上式右边:
[
\alpha = (\varepsilon_1, \dots, \varepsilon_n) A \begin{pmatrix} y_1 \ y_2 \ \vdots \ y_n \end{pmatrix}
]
现在我们有了 (\alpha) 在旧基下的两种表示:
[
(\varepsilon_1, \dots, \varepsilon_n) \begin{pmatrix} x_1 \ \vdots \ x_n \end{pmatrix} = (\varepsilon_1, \dots, \varepsilon_n) A \begin{pmatrix} y_1 \ \vdots \ y_n \end{pmatrix}
]
因为旧基 (\varepsilon_1, \dots, \varepsilon_n) 线性无关,所以它们的线性组合表示是唯一的,因此系数必须相等:
[
\begin{pmatrix} x_1 \ x_2 \ \vdots \ x_n \end{pmatrix} = A \begin{pmatrix} y_1 \ y_2 \ \vdots \ y_n \end{pmatrix}
]
即:
[
\boldsymbol{x = Ay}
]
这就是坐标变换公式。两边同时左乘 (A^{-1}),得到逆变换:
[
\boldsymbol{y = A^{-1}x}
]
3. 最容易混淆的点:公式的方向
90%的学生都会在这里记错,一定要记住:
- (x) 是旧基下的坐标
- (y) 是新基下的坐标
- 公式是:旧坐标 = 过渡矩阵 × 新坐标((x = Ay))
绝对不能记成 (y = Ax)!下面用一个最简单的例子来验证:
例:设 (V = \mathbb{R}^2),旧基为标准基 (\varepsilon_1 = (1,0), \varepsilon_2 = (0,1)),新基为 (\eta_1 = 2\varepsilon_1, \eta_2 = \varepsilon_2)。
- 过渡矩阵 (A) 的列是新基在旧基下的坐标:
[A = \begin{pmatrix} 2 & 0 \ 0 & 1 \end{pmatrix}] - 取向量 (\alpha = 2\varepsilon_1 + \varepsilon_2),它在旧基下的坐标 (x = (2, 1)^T)。
- 它在新基下的坐标 (y = (1, 1)^T)(因为 (\alpha = 1 \cdot \eta_1 + 1 \cdot \eta_2))。
- 验证公式:(Ay = \begin{pmatrix} 2 & 0 \ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 \ 1 \end{pmatrix} = \begin{pmatrix} 2 \ 1 \end{pmatrix} = x),完全正确。
- 如果错误地用 (y = Ax),会得到 (y = \begin{pmatrix} 2 & 0 \ 0 & 1 \end{pmatrix} \begin{pmatrix} 2 \ 1 \end{pmatrix} = \begin{pmatrix} 4 \ 1 \end{pmatrix}),明显错误。
记忆口诀:旧坐标等于A乘新坐标
三、完整计算例题
下面通过一个完整的例子演示如何计算过渡矩阵和坐标变换。
例:在 (\mathbb{R}^3) 中,已知两组基:
- 旧基:(\varepsilon_1 = (1,0,0), \varepsilon_2 = (0,1,0), \varepsilon_3 = (0,0,1))
- 新基:(\eta_1 = (1,0,0), \eta_2 = (1,1,0), \eta_3 = (1,1,1))
(1) 求由旧基到新基的过渡矩阵 (A);
(2) 求向量 (\alpha = (2, 3, 4)) 在新基下的坐标 (y)。
解:
(1) 过渡矩阵 (A) 的列是新基向量在旧基下的坐标:
- (\eta_1 = 1\varepsilon_1 + 0\varepsilon_2 + 0\varepsilon_3),坐标为 ((1,0,0)^T)
- (\eta_2 = 1\varepsilon_1 + 1\varepsilon_2 + 0\varepsilon_3),坐标为 ((1,1,0)^T)
- (\eta_3 = 1\varepsilon_1 + 1\varepsilon_2 + 1\varepsilon_3),坐标为 ((1,1,1)^T)
因此过渡矩阵:
[
A = \begin{pmatrix} 1 & 1 & 1 \ 0 & 1 & 1 \ 0 & 0 & 1 \end{pmatrix}
]
(2) 向量 (\alpha) 在旧基下的坐标 (x = (2, 3, 4)^T)。根据坐标变换公式 (y = A^{-1}x),先求 (A^{-1}):
[
A^{-1} = \begin{pmatrix} 1 & -1 & 0 \ 0 & 1 & -1 \ 0 & 0 & 1 \end{pmatrix}
]
因此:
[
y = A^{-1}x = \begin{pmatrix} 1 & -1 & 0 \ 0 & 1 & -1 \ 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} 2 \ 3 \ 4 \end{pmatrix} = \begin{pmatrix} 2-3 \ 3-4 \ 4 \end{pmatrix} = \begin{pmatrix} -1 \ -1 \ 4 \end{pmatrix}
]
验证:(-1 \cdot \eta_1 + (-1) \cdot \eta_2 + 4 \cdot \eta_3 = -1(1,0,0) -1(1,1,0) +4(1,1,1) = (2,3,4) = \alpha),正确。
四、常见误区总结
- 过渡矩阵的列搞成行:过渡矩阵的列是新基在旧基下的坐标,不是行。
- 坐标变换公式方向搞反:记住"旧坐标 = A × 新坐标",不要搞反。
- 过渡矩阵的定义搞反:"由旧基到新基的过渡矩阵"和"由新基到旧基的过渡矩阵"互为逆矩阵。
- 行向量与列向量混淆:本教材使用列向量作为坐标,公式是 (x = Ay)。如果使用行向量,公式会变成 (y = xA^{-1}),注意区分。
五、核心逻辑链条总结
新基向量用旧基线性表出
⇒ 写出基变换公式 (η₁,…,ηₙ) = (ε₁,…,εₙ)A
⇒ A的第j列是ηⱼ在旧基下的坐标
⇒ A可逆(因为新基线性无关)
⇒ 向量α在旧基下坐标x,新基下坐标y
⇒ α = (ε₁,…,εₙ)x = (η₁,…,ηₙ)y
⇒ 代入基变换公式得 (ε₁,…,εₙ)x = (ε₁,…,εₙ)Ay
⇒ 由旧基线性无关得 x = Ay
这是基变换与坐标变换最经典的几何例子,它将抽象的代数公式与直观的平面旋转变换完美结合,同时也是区分"主动变换"与"被动变换"的绝佳素材。下面我将为你逐行解析公式推导,深入揭示其几何本质,并澄清最容易混淆的"基旋转"与"向量旋转"的区别。
一、过渡矩阵的构造
1. 两组基的几何意义
- 旧基(标准基):(\varepsilon_1 = (1,0))(x轴单位向量),(\varepsilon_2 = (0,1))(y轴单位向量)
- 新基(旋转基):(\eta_1 = (\cos\theta, \sin\theta)),(\eta_2 = (-\sin\theta, \cos\theta))
几何直观:新基 (\eta_1, \eta_2) 是将旧基 (\varepsilon_1, \varepsilon_2) 绕原点逆时针旋转θ角得到的。
- (\varepsilon_1) 逆时针转θ角:((\cos\theta, \sin\theta) = \eta_1)
- (\varepsilon_2) 逆时针转θ角:((-\sin\theta, \cos\theta) = \eta_2)
2. 过渡矩阵的计算
根据过渡矩阵的定义:过渡矩阵的第j列是新基向量ηⱼ在旧基下的坐标列。
因为旧基是标准基,向量在标准基下的坐标就是它本身的分量,因此:
- (\eta_1) 在旧基下的坐标:((\cos\theta, \sin\theta)^T)(过渡矩阵第1列)
- (\eta_2) 在旧基下的坐标:((-\sin\theta, \cos\theta)^T)(过渡矩阵第2列)
因此,由旧基到新基的过渡矩阵为:
[
A = R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \ \sin\theta & \cos\theta \end{pmatrix}
]
这正是平面上逆时针旋转θ角的旋转矩阵。
基变换公式为:
[
(\eta_1, \eta_2) = (\varepsilon_1, \varepsilon_2) \begin{pmatrix} \cos\theta & -\sin\theta \ \sin\theta & \cos\theta \end{pmatrix}
]
二、坐标变换公式推导
1. 基本公式回顾
设向量 (\alpha) 在旧基下的坐标为 (x = (x_1, x_2)^T),在新基下的坐标为 (y = (y_1, y_2)^T)。根据坐标变换的基本公式:
[
x = Ay \implies y = A^{-1}x
]
2. 旋转矩阵的逆矩阵
旋转矩阵 (R(\theta)) 是正交矩阵(列向量是单位正交向量组),正交矩阵的逆矩阵等于它的转置矩阵:
[
R(\theta)^{-1} = R(\theta)^T = \begin{pmatrix} \cos\theta & \sin\theta \ -\sin\theta & \cos\theta \end{pmatrix}
]
注意到 (R(\theta)^T = R(-\theta)),即逆时针旋转θ角的逆变换是顺时针旋转θ角。
3. 最终坐标变换公式
将逆矩阵代入坐标变换公式,得:
[
\begin{pmatrix} y_1 \ y_2 \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \ -\sin\theta & \cos\theta \end{pmatrix} \begin{pmatrix} x_1 \ x_2 \end{pmatrix}
]
三、核心几何意义:被动变换与主动变换的区别
这是这个例子最容易让人困惑的地方,也是线性代数中最经典的"视角转换"问题。
1. 被动变换(基变换):基动,向量不动
场景:坐标系(基)绕原点逆时针旋转θ角,向量本身保持不动,求向量在新坐标系下的坐标。
结论:新坐标 = 原坐标 × 顺时针旋转θ角的矩阵 (R(-\theta))。
直观解释:坐标系逆时针转了θ角,相当于向量相对于坐标系顺时针转了θ角,因此坐标也跟着顺时针转了θ角。
2. 主动变换(向量变换):基不动,向量动
场景:坐标系(基)保持不动,向量绕原点逆时针旋转θ角,求旋转后向量的坐标。
结论:新坐标 = 原坐标 × 逆时针旋转θ角的矩阵 (R(\theta))。
3. 数值验证(θ=90°)
取θ=90°,此时:
- 旋转矩阵 (R(90°) = \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix})
- 逆矩阵 (R(-90°) = \begin{pmatrix} 0 & 1 \ -1 & 0 \end{pmatrix})
被动变换验证:
- 新基:(\eta_1 = (0,1)),(\eta_2 = (-1,0))(标准基逆时针转90°)
- 取向量 (\alpha = (1,0))(x轴单位向量),在旧基下坐标 (x = (1,0)^T)
- 在新基下,(\alpha = 0 \cdot \eta_1 + (-1) \cdot \eta_2),故新坐标 (y = (0,-1)^T)
- 用公式计算:(y = R(-90°)x = \begin{pmatrix} 0 & 1 \ -1 & 0 \end{pmatrix} \begin{pmatrix} 1 \ 0 \end{pmatrix} = \begin{pmatrix} 0 \ -1 \end{pmatrix}),完全正确。
主动变换验证:
- 向量 (\alpha = (1,0)) 逆时针转90°,得到向量 (\alpha' = (0,1))
- 用公式计算:(\alpha' = R(90°)x = \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 \ 0 \end{pmatrix} = \begin{pmatrix} 0 \ 1 \end{pmatrix}),完全正确。
4. 关键对比表
| 变换类型 | 操作 | 坐标变换公式 |
|---|---|---|
| 被动变换 | 基逆时针转θ,向量不动 | (y = R(-\theta)x) |
| 主动变换 | 向量逆时针转θ,基不动 | (x' = R(\theta)x) |
记忆口诀:基转θ,坐标转-θ;向量转θ,坐标转θ
四、重要性质与拓展
- 正交基变换的特殊性:当两组基都是标准正交基时,过渡矩阵是正交矩阵,逆矩阵等于转置矩阵,无需计算复杂的逆矩阵。
- 旋转的复合:先转θ₁再转θ₂,等价于转θ₁+θ₂,对应矩阵乘法 (R(\theta_2)R(\theta_1) = R(\theta_1+\theta_2))。
- 三维空间的推广:三维空间中绕坐标轴的旋转变换也遵循同样的规律,过渡矩阵是三维旋转矩阵,坐标变换是其转置。
五、常见易错点总结
- 搞反坐标变换方向:记住"旧坐标=A×新坐标",不要记成"新坐标=A×旧坐标"。
- 混淆主动与被动变换:基旋转和向量旋转的坐标变换公式是互逆的,一定要先明确是哪个在动。
- 忘记正交矩阵性质:旋转矩阵的逆是转置,不要用伴随矩阵法去计算逆矩阵,浪费时间还容易出错。
这是线性空间结构理论的核心内容,它定义了子空间的两种基本运算——交与和,是后续直和分解、维数公式等重要结论的基础。下面我将为你严格证明引理5.5,深入解析交与和的本质区别,补充几何直观例子,并澄清最常见的概念误区。
一、子空间的交与和的定义
定义5.10:设 (V) 是域 (F) 上的线性空间,(W_1) 和 (W_2) 是 (V) 的两个子空间。
- 交:(W_1) 与 (W_2) 的交是同时属于两个子空间的所有向量的集合,记作
[W_1 \cap W_2 = { \alpha \in V \mid \alpha \in W_1 \text{ 且 } \alpha \in W_2 }] - 和:(W_1) 与 (W_2) 的和是所有可以表示为 (W_1) 中一个向量与 (W_2) 中一个向量之和的向量的集合,记作
[W_1 + W_2 = { \alpha_1 + \alpha_2 \mid \alpha_1 \in W_1, \alpha_2 \in W_2 }]
二、引理5.5的严格证明
引理5.5:两个线性子空间的交与和均为线性子空间。
1. 证明 (W_1 \cap W_2) 是子空间
要证明一个集合是子空间,需要验证三个条件:非空性、加法封闭性、数乘封闭性。
- 非空性:因为 (W_1) 和 (W_2) 都是子空间,所以零向量 (0 \in W_1) 且 (0 \in W_2),故 (0 \in W_1 \cap W_2)。
- 加法封闭性:若 (\alpha, \beta \in W_1 \cap W_2),则 (\alpha, \beta \in W_1) 且 (\alpha, \beta \in W_2)。
因为 (W_1) 是子空间,所以 (\alpha + \beta \in W_1);同理,(\alpha + \beta \in W_2)。
因此 (\alpha + \beta \in W_1 \cap W_2)。 - 数乘封闭性:若 (\alpha \in W_1 \cap W_2),(\lambda \in F),则 (\alpha \in W_1) 且 (\alpha \in W_2)。
因为 (W_1) 是子空间,所以 (\lambda \alpha \in W_1);同理,(\lambda \alpha \in W_2)。
因此 (\lambda \alpha \in W_1 \cap W_2)。
综上,(W_1 \cap W_2) 满足子空间的三个条件,故是 (V) 的子空间。□
2. 证明 (W_1 + W_2) 是子空间
同样验证三个条件:
- 非空性:(0 = 0 + 0),其中 (0 \in W_1) 且 (0 \in W_2),故 (0 \in W_1 + W_2)。
- 加法封闭性:若 (\alpha, \beta \in W_1 + W_2),则存在 (\alpha_1, \beta_1 \in W_1) 和 (\alpha_2, \beta_2 \in W_2),使得
[\alpha = \alpha_1 + \alpha_2, \quad \beta = \beta_1 + \beta_2]
因此
[\alpha + \beta = (\alpha_1 + \alpha_2) + (\beta_1 + \beta_2) = (\alpha_1 + \beta_1) + (\alpha_2 + \beta_2)]
因为 (W_1) 是子空间,所以 (\alpha_1 + \beta_1 \in W_1);同理,(\alpha_2 + \beta_2 \in W_2)。
故 (\alpha + \beta \in W_1 + W_2)。 - 数乘封闭性:若 (\alpha \in W_1 + W_2),(\lambda \in F),则存在 (\alpha_1 \in W_1) 和 (\alpha_2 \in W_2),使得
[\alpha = \alpha_1 + \alpha_2]
因此
[\lambda \alpha = \lambda(\alpha_1 + \alpha_2) = \lambda \alpha_1 + \lambda \alpha_2]
因为 (W_1) 是子空间,所以 (\lambda \alpha_1 \in W_1);同理,(\lambda \alpha_2 \in W_2)。
故 (\lambda \alpha \in W_1 + W_2)。
综上,(W_1 + W_2) 满足子空间的三个条件,故是 (V) 的子空间。□
三、几何直观例子(以 (\mathbb{R}^3) 为例)
通过三维空间中的平面和直线,可以非常直观地理解子空间的交与和。
例1:两个平面的交与和
- 设 (W_1 = { (x,y,0) \mid x,y \in \mathbb{R} })(xOy平面)
- 设 (W_2 = { (x,0,z) \mid x,z \in \mathbb{R} })(xOz平面)
则:
- 交:(W_1 \cap W_2 = { (x,0,0) \mid x \in \mathbb{R} })(x轴)
- 和:(W_1 + W_2 = \mathbb{R}^3)(整个三维空间)
因为任意三维向量 ((x,y,z)) 都可以表示为 ((x,y,0) + (0,0,z)),其中 ((x,y,0) \in W_1),((0,0,z) \in W_2)。
例2:直线与平面的交与和
- 设 (W_1 = { (x,0,0) \mid x \in \mathbb{R} })(x轴)
- 设 (W_2 = { (0,y,z) \mid y,z \in \mathbb{R} })(yOz平面)
则:
- 交:(W_1 \cap W_2 = { (0,0,0) })(零子空间)
- 和:(W_1 + W_2 = \mathbb{R}^3)(整个三维空间)
例3:两条直线的交与和
- 设 (W_1 = { (x,0,0) \mid x \in \mathbb{R} })(x轴)
- 设 (W_2 = { (0,y,0) \mid y \in \mathbb{R} })(y轴)
则:
- 交:(W_1 \cap W_2 = { (0,0,0) })(零子空间)
- 和:(W_1 + W_2 = { (x,y,0) \mid x,y \in \mathbb{R} })(xOy平面)
四、基本性质
- 交换律:(W_1 \cap W_2 = W_2 \cap W_1),(W_1 + W_2 = W_2 + W_1)
- 结合律:((W_1 \cap W_2) \cap W_3 = W_1 \cap (W_2 \cap W_3)),((W_1 + W_2) + W_3 = W_1 + (W_2 + W_3))
- 包含关系:
- (W_1 \cap W_2 \subseteq W_1),(W_1 \cap W_2 \subseteq W_2)
- (W_1 \subseteq W_1 + W_2),(W_2 \subseteq W_1 + W_2)
- 极端情况:
- 若 (W_1 \subseteq W_2),则 (W_1 \cap W_2 = W_1),(W_1 + W_2 = W_2)
- 特别地,(W \cap W = W),(W + W = W)
五、最常见的概念误区:和 ≠ 并集
极其重要:子空间的和 (W_1 + W_2) 与集合的并集 (W_1 \cup W_2) 是完全不同的概念!
- 并集:(W_1 \cup W_2 = { \alpha \in V \mid \alpha \in W_1 \text{ 或 } \alpha \in W_2 })
- 和:(W_1 + W_2 = { \alpha_1 + \alpha_2 \mid \alpha_1 \in W_1, \alpha_2 \in W_2 })
关键区别:并集一般不是子空间,因为它对加法不封闭;而和是包含并集的最小子空间。
反例:设 (W_1) 是x轴,(W_2) 是y轴。
- 并集 (W_1 \cup W_2) 包含所有x轴和y轴上的点,但向量 ((1,1)) 不在并集中。
- 和 (W_1 + W_2) 是整个xOy平面,包含所有形如 ((x,y)) 的向量。
结论:(W_1 \cup W_2 \subseteq W_1 + W_2),等号成立当且仅当 (W_1 \subseteq W_2) 或 (W_2 \subseteq W_1)。
六、后续内容预告
下一个核心定理是维数公式(也称为格拉斯曼公式):
[
\dim(W_1 + W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)
]
它揭示了子空间的交与和的维数之间的基本关系,是线性空间结构理论中最重要的公式之一。
这是子空间交与和的极端情况,展示了全空间 (V) 和零子空间 ({0}) 与任意子空间 (W) 进行交与和运算的结果。下面我将为你严格证明这三个等式,并解释其几何意义和一般推广。
一、例5.15完整表述
设 (V) 是域 (F) 上的线性空间,(W) 是 (V) 的任意子空间,则:
- (V \cap W = W)
- (V + W = V)
- ({0} + W = W)
二、严格证明
证明两个集合相等的标准方法是证明互相包含,即左边包含于右边,且右边包含于左边。
1. 证明 (V \cap W = W)
-
右边包含于左边((W \subseteq V \cap W)):
因为 (W) 是 (V) 的子空间,所以对任意 (\alpha \in W),都有 (\alpha \in V)。
因此 (\alpha \in V) 且 (\alpha \in W),即 (\alpha \in V \cap W)。
故 (W \subseteq V \cap W)。 -
左边包含于右边((V \cap W \subseteq W)):
对任意 (\alpha \in V \cap W),根据交的定义,(\alpha \in W)。
故 (V \cap W \subseteq W)。
综上,(V \cap W = W)。□
2. 证明 (V + W = V)
-
右边包含于左边((V \subseteq V + W)):
对任意 (\alpha \in V),因为 (W) 是子空间,所以零向量 (0 \in W)。
因此 (\alpha = \alpha + 0),其中 (\alpha \in V),(0 \in W)。
根据和的定义,(\alpha \in V + W)。
故 (V \subseteq V + W)。 -
左边包含于右边((V + W \subseteq V)):
对任意 (\alpha \in V + W),根据和的定义,存在 (\alpha_1 \in V),(\alpha_2 \in W),使得 (\alpha = \alpha_1 + \alpha_2)。
因为 (W) 是 (V) 的子空间,所以 (\alpha_2 \in V)。
又因为 (V) 对加法封闭,所以 (\alpha_1 + \alpha_2 \in V),即 (\alpha \in V)。
故 (V + W \subseteq V)。
综上,(V + W = V)。□
3. 证明 ({0} + W = W)
-
右边包含于左边((W \subseteq {0} + W)):
对任意 (\alpha \in W),有 (\alpha = 0 + \alpha),其中 (0 \in {0}),(\alpha \in W)。
根据和的定义,(\alpha \in {0} + W)。
故 (W \subseteq {0} + W)。 -
左边包含于右边(({0} + W \subseteq W)):
对任意 (\alpha \in {0} + W),根据和的定义,存在 (0 \in {0}),(\alpha_2 \in W),使得 (\alpha = 0 + \alpha_2 = \alpha_2)。
因此 (\alpha \in W)。
故 ({0} + W \subseteq W)。
综上,({0} + W = W)。□
三、几何直观例子(以 (\mathbb{R}^3) 为例)
设 (V = \mathbb{R}^3)(整个三维空间),(W = { (x,y,0) \mid x,y \in \mathbb{R} })(xOy平面),则:
- (V \cap W = \mathbb{R}^3 \cap \text{xOy平面} = \text{xOy平面} = W)
- (V + W = \mathbb{R}^3 + \text{xOy平面} = \mathbb{R}^3 = V)
- ({0} + W = {(0,0,0)} + \text{xOy平面} = \text{xOy平面} = W)
完全符合我们的结论。
四、一般推广
例5.15是以下更一般性质的特例:
性质:若 (W_1 \subseteq W_2) 是 (V) 的两个子空间,则:
- (W_1 \cap W_2 = W_1)
- (W_1 + W_2 = W_2)
证明:与例5.15的证明完全类似,只需将 (V) 替换为 (W_2),将 ({0}) 替换为 (W_1) 即可。
验证:当 (W_2 = V) 时,得到 (W_1 \cap V = W_1) 和 (W_1 + V = V);当 (W_1 = {0}) 时,得到 ({0} \cap W_2 = {0}) 和 ({0} + W_2 = W_2),与例5.15一致。
五、在维数公式中的验证
我们可以用维数公式来验证这些结论的正确性。维数公式为:
[
\dim(W_1 + W_2) + \dim(W_1 \cap W_2) = \dim W_1 + \dim W_2
]
对于 (W_1 = V),(W_2 = W):
- 左边:(\dim(V + W) + \dim(V \cap W) = \dim V + \dim W)
- 右边:(\dim V + \dim W)
两边相等,验证成立。
对于 (W_1 = {0}),(W_2 = W):
- 左边:(\dim({0} + W) + \dim({0} \cap W) = \dim W + \dim{0} = \dim W + 0 = \dim W)
- 右边:(\dim{0} + \dim W = 0 + \dim W = \dim W)
两边相等,验证成立。
这是子空间交与和运算的经典几何例子,同时将二元运算推广到了多个子空间的情况。下面我将为你严格证明例5.16的结论,用维数公式进行验证,并深入解析交与和的运算律及其推广。
一、例5.16的严格证明
已知:在 (\mathbb{R}^3) 中,标准基为 (\varepsilon_1=(1,0,0), \varepsilon_2=(0,1,0), \varepsilon_3=(0,0,1))。
- (W_1 = \operatorname{span}{\varepsilon_1, \varepsilon_2} = { (a,b,0) \mid a,b \in \mathbb{R} })(xOy平面)
- (W_2 = \operatorname{span}{\varepsilon_1, \varepsilon_3} = { (a,0,c) \mid a,c \in \mathbb{R} })(xOz平面)
要证:
- (W_1 \cap W_2 = \mathbb{R}\varepsilon_1 = { (a,0,0) \mid a \in \mathbb{R} })(x轴)
- (W_1 + W_2 = \mathbb{R}^3)
1. 证明 (W_1 \cap W_2 = \mathbb{R}\varepsilon_1)
证明两个集合相等,需证互相包含。
-
(\mathbb{R}\varepsilon_1 \subseteq W_1 \cap W_2):
对任意 (\alpha = (a,0,0) \in \mathbb{R}\varepsilon_1),显然 (\alpha = a\varepsilon_1 + 0\varepsilon_2 \in W_1),且 (\alpha = a\varepsilon_1 + 0\varepsilon_3 \in W_2)。
因此 (\alpha \in W_1 \cap W_2)。 -
(W_1 \cap W_2 \subseteq \mathbb{R}\varepsilon_1):
对任意 (\alpha \in W_1 \cap W_2),因为 (\alpha \in W_1),所以 (\alpha = (a,b,0));又因为 (\alpha \in W_2),所以 (\alpha = (a',0,c'))。
比较分量得:(b = 0),(c' = 0),(a = a')。
因此 (\alpha = (a,0,0) = a\varepsilon_1 \in \mathbb{R}\varepsilon_1)。
综上,(W_1 \cap W_2 = \mathbb{R}\varepsilon_1)。□
2. 证明 (W_1 + W_2 = \mathbb{R}^3)
同样证互相包含。
-
(W_1 + W_2 \subseteq \mathbb{R}^3):
因为 (W_1) 和 (W_2) 都是 (\mathbb{R}^3) 的子空间,所以它们的和也是 (\mathbb{R}^3) 的子空间,故 (W_1 + W_2 \subseteq \mathbb{R}^3)。 -
(\mathbb{R}^3 \subseteq W_1 + W_2):
对任意 (\alpha = (x,y,z) \in \mathbb{R}^3),我们需要找到 (\alpha_1 \in W_1) 和 (\alpha_2 \in W_2),使得 (\alpha = \alpha_1 + \alpha_2)。
取 (\alpha_1 = (0,y,0) \in W_1),(\alpha_2 = (x,0,z) \in W_2),则
[\alpha_1 + \alpha_2 = (0,y,0) + (x,0,z) = (x,y,z) = \alpha]
因此 (\alpha \in W_1 + W_2)。
综上,(W_1 + W_2 = \mathbb{R}^3)。□
3. 维数公式验证
维数公式:(\dim(W_1 + W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2))
代入数值:
- (\dim W_1 = 2),(\dim W_2 = 2),(\dim(W_1 \cap W_2) = 1)
- 右边:(2 + 2 - 1 = 3)
- 左边:(\dim(W_1 + W_2) = \dim \mathbb{R}^3 = 3)
两边相等,验证成立。
二、交与和的运算律
子空间的交与和运算满足以下基本运算律:
1. 交换律
- 交的交换律:(W_1 \cap W_2 = W_2 \cap W_1)
- 和的交换律:(W_1 + W_2 = W_2 + W_1)
证明:交与和的定义都是对称的,交换两个子空间的顺序不改变集合的元素。
2. 结合律
- 交的结合律:((W_1 \cap W_2) \cap W_3 = W_1 \cap (W_2 \cap W_3))
- 和的结合律:((W_1 + W_2) + W_3 = W_1 + (W_2 + W_3))
证明(交的结合律):
- (\alpha \in (W_1 \cap W_2) \cap W_3) 当且仅当 (\alpha \in W_1) 且 (\alpha \in W_2) 且 (\alpha \in W_3)
- (\alpha \in W_1 \cap (W_2 \cap W_3)) 当且仅当 (\alpha \in W_1) 且 (\alpha \in W_2) 且 (\alpha \in W_3)
两者完全等价,故相等。□
证明(和的结合律):
- (\alpha \in (W_1 + W_2) + W_3) 当且仅当存在 (\alpha_1 \in W_1, \alpha_2 \in W_2, \alpha_3 \in W_3),使得 (\alpha = (\alpha_1 + \alpha_2) + \alpha_3)
- (\alpha \in W_1 + (W_2 + W_3)) 当且仅当存在 (\alpha_1 \in W_1, \alpha_2 \in W_2, \alpha_3 \in W_3),使得 (\alpha = \alpha_1 + (\alpha_2 + \alpha_3))
由向量加法的结合律,((\alpha_1 + \alpha_2) + \alpha_3 = \alpha_1 + (\alpha_2 + \alpha_3)),故两者相等。□
三、多个子空间的交与和
由于交与和运算满足结合律,我们可以将其推广到任意有限多个子空间的情况。
1. 多个子空间的交
设 (W_1, W_2, \dots, W_s) 是 (V) 的子空间,它们的交定义为:
[
\bigcap_{i=1}^s W_i = W_1 \cap W_2 \cap \dots \cap W_s = { \alpha \in V \mid \alpha \in W_i \text{ 对所有 } i=1,2,\dots,s }
]
即同时属于所有子空间的向量的集合。
2. 多个子空间的和
设 (W_1, W_2, \dots, W_s) 是 (V) 的子空间,它们的和定义为:
[
\sum_{i=1}^s W_i = W_1 + W_2 + \dots + W_s = { \alpha_1 + \alpha_2 + \dots + \alpha_s \mid \alpha_i \in W_i \text{ 对所有 } i=1,2,\dots,s }
]
即所有可以表示为每个子空间中一个向量之和的向量的集合。
3. 重要性质
若每个子空间 (W_i) 由集合 (S_i) 生成,即 (W_i = \operatorname{span}(S_i)),则它们的和由所有生成元集合的并集生成:
[
\sum_{i=1}^s W_i = \operatorname{span}\left( \bigcup_{i=1}^s S_i \right)
]
验证(例5.16):
- (W_1 = \operatorname{span}{\varepsilon_1, \varepsilon_2}),(W_2 = \operatorname{span}{\varepsilon_1, \varepsilon_3})
- (\bigcup_{i=1}^2 S_i = {\varepsilon_1, \varepsilon_2, \varepsilon_3})
- (\operatorname{span}{\varepsilon_1, \varepsilon_2, \varepsilon_3} = \mathbb{R}^3 = W_1 + W_2),完全符合。
四、常见误区提醒
-
多个子空间的并不是子空间:子空间的并集一般对加法不封闭,而和是包含并集的最小子空间。
例如,三个坐标平面的并集不是 (\mathbb{R}^3),因为向量 ((1,1,1)) 不在任何一个坐标平面中,但它们的和是 (\mathbb{R}^3)。 -
和的表示不唯一:除非是直和,否则一个向量在和中的表示方法不唯一。
例如,在例5.16中,向量 ((1,1,1)) 可以表示为 ((0,1,0) + (1,0,1)),也可以表示为 ((1,1,0) + (0,0,1))。
这是子空间交运算在线性方程组理论中的核心应用,它建立了"子空间的交"与"方程组的联立"之间的完美对应关系,是求解多个齐次线性方程组公共解的标准方法。下面我将为你严格证明这个结论,深入解析其几何意义,并通过具体数值例子演示如何应用。
一、例5.17完整表述与严格证明
1. 结论1:两个方程组解空间的交
设 (A) 是 (m \times n) 矩阵,(B) 是 (k \times n) 矩阵,(W_1) 是齐次线性方程组 (Ax = 0) 的解空间,(W_2) 是齐次线性方程组 (Bx = 0) 的解空间。则:
[
W_1 \cap W_2 = \left{ x \in F^n \mid \begin{pmatrix} A \ B \end{pmatrix} x = 0 \right}
]
即两个解空间的交是将系数矩阵上下分块得到的新方程组的解空间。
证明:
根据交的定义,(x \in W_1 \cap W_2) 当且仅当 (x \in W_1) 且 (x \in W_2)。
- (x \in W_1) 当且仅当 (Ax = 0)
- (x \in W_2) 当且仅当 (Bx = 0)
因此,(x \in W_1 \cap W_2) 当且仅当同时满足 (Ax = 0) 和 (Bx = 0),这等价于:
[
\begin{pmatrix} A \ B \end{pmatrix} x = \begin{pmatrix} Ax \ Bx \end{pmatrix} = \begin{pmatrix} 0 \ 0 \end{pmatrix} = 0
]
□
2. 结论2:单个方程组解空间是各方程解空间的交
设 (A = (a_{ij})) 是 (m \times n) 矩阵,其第 (i) 行是 (\alpha_i = (a_{i1}, a_{i2}, \dots, a_{in}))。记 (V_i) 是单个齐次线性方程 (\alpha_i x = a_{i1}x_1 + a_{i2}x_2 + \dots + a_{in}x_n = 0) 的解空间,则:
[
W = \bigcap_{i=1}^m V_i
]
即整个方程组 (Ax = 0) 的解空间是其所有单个方程解空间的交。
证明:
(x \in W) 当且仅当 (Ax = 0),当且仅当对所有 (i = 1, 2, \dots, m),有 (\alpha_i x = 0),当且仅当对所有 (i = 1, 2, \dots, m),有 (x \in V_i),当且仅当 (x \in \bigcap_{i=1}^m V_i)。
□
二、几何意义与理论价值
1. 几何直观
在 (n) 维空间 (F^n) 中,单个齐次线性方程 (a_1x_1 + \dots + a_nx_n = 0) 的解空间是一个n-1维子空间,称为超平面。
- 一个齐次线性方程组的解空间,就是若干个超平面的交。
- 两个方程组的公共解,就是这两个方程组各自对应的超平面族的交。
2. 理论价值
这个结论的核心价值在于:将抽象的子空间交运算转化为具体的矩阵分块运算。
- 以前求两个子空间的交,需要先分别求出两个子空间的基,再求它们的交的基,过程繁琐。
- 现在,对于解空间这种特殊的子空间,只需要将它们的系数矩阵上下拼起来,求新方程组的解空间即可,大大简化了计算。
三、具体数值例子
例:在 (\mathbb{R}^3) 中,设
- (A = \begin{pmatrix} 1 & 1 & 0 \end{pmatrix}),方程组 (Ax = 0) 即 (x_1 + x_2 = 0),解空间 (W_1 = \operatorname{span}{(-1,1,0), (0,0,1)})
- (B = \begin{pmatrix} 1 & 0 & 1 \end{pmatrix}),方程组 (Bx = 0) 即 (x_1 + x_3 = 0),解空间 (W_2 = \operatorname{span}{(-1,0,1), (0,1,0)})
求 (W_1 \cap W_2)。
解法1(利用例5.17结论):
将系数矩阵上下分块,得到新方程组:
[
\begin{pmatrix} 1 & 1 & 0 \ 1 & 0 & 1 \end{pmatrix} x = 0
]
对系数矩阵做初等行变换:
[
\begin{pmatrix} 1 & 1 & 0 \ 1 & 0 & 1 \end{pmatrix} \rightarrow \begin{pmatrix} 1 & 1 & 0 \ 0 & -1 & 1 \end{pmatrix} \rightarrow \begin{pmatrix} 1 & 0 & 1 \ 0 & 1 & -1 \end{pmatrix}
]
得到同解方程组:
[
\begin{cases}
x_1 = -x_3 \
x_2 = x_3
\end{cases}
]
令自由未知量 (x_3 = 1),得基础解系 ((-1, 1, 1)^T)。因此:
[
W_1 \cap W_2 = \operatorname{span}{(-1, 1, 1)}
]
解法2(传统方法,验证结果):
设 (\alpha \in W_1 \cap W_2),则 (\alpha) 可以表示为 (W_1) 基的线性组合,也可以表示为 (W_2) 基的线性组合:
[
\alpha = k_1(-1,1,0) + k_2(0,0,1) = l_1(-1,0,1) + l_2(0,1,0)
]
比较分量得:
[
\begin{cases}
-k_1 = -l_1 \
k_1 = l_2 \
k_2 = l_1
\end{cases}
]
解得 (l_1 = k_1),(l_2 = k_1),(k_2 = k_1)。因此:
[
\alpha = k_1(-1,1,0) + k_1(0,0,1) = k_1(-1,1,1)
]
与解法1结果完全一致。
结论:利用例5.17的结论,计算过程明显更简洁高效。
四、维数计算应用
结合维数公式,我们可以快速计算两个解空间交的维数。
公式:
[
\dim(W_1 \cap W_2) = n - r\left( \begin{pmatrix} A \ B \end{pmatrix} \right)
]
验证(上例):
- (n = 3)
- (r\left( \begin{pmatrix} 1 & 1 & 0 \ 1 & 0 & 1 \end{pmatrix} \right) = 2)
- (\dim(W_1 \cap W_2) = 3 - 2 = 1),与我们计算的结果一致。
五、推广到多个方程组
例5.17的结论可以直接推广到任意有限多个齐次线性方程组的情况:
设 (A_1x = 0, A_2x = 0, \dots, A_kx = 0) 是 (k) 个 (n) 元齐次线性方程组,它们的解空间分别为 (W_1, W_2, \dots, W_k),则它们的公共解空间为:
[
\bigcap_{i=1}^k W_i = \left{ x \in F^n \mid \begin{pmatrix} A_1 \ A_2 \ \vdots \ A_k \end{pmatrix} x = 0 \right}
]
六、常见应用场景
- 求多个齐次线性方程组的公共解:这是最直接的应用。
- 求两个子空间的交:如果两个子空间都是齐次线性方程组的解空间,就可以用这个方法。
- 求矩阵的零空间:矩阵的零空间就是其行向量对应的所有超平面的交。
这是线性代数中最核心的定理之一,被称为维数公式或格拉斯曼公式。它揭示了子空间的交与和的维数之间的基本关系,是线性空间结构理论的基石。教材中的证明非常经典,但有些步骤写得比较简略,下面我将为你逐行拆解证明过程,补充所有省略的逻辑,并深入解析其几何意义和应用。
一、定理完整表述
定理5.3(维数公式):设 (V_1, V_2) 是线性空间 (V) 的两个有限维子空间,则
[
\dim(V_1 + V_2) = \dim V_1 + \dim V_2 - \dim(V_1 \cap V_2)
]
直观类比:这个公式与集合的容斥原理 (|A \cup B| = |A| + |B| - |A \cap B|) 非常相似。
- 子空间的和 (V_1 + V_2) 对应集合的并集 (A \cup B)
- 子空间的交 (V_1 \cap V_2) 对应集合的交集 (A \cap B)
- 维数 (\dim) 对应集合的基数 (|\cdot|)
二、证明过程逐行拆解
第一步:构造基(证明的核心思路)
设:
- (\dim(V_1 \cap V_2) = r),取 (V_1 \cap V_2) 的一组基 (\alpha_1, \alpha_2, \dots, \alpha_r)
- (\dim V_1 = m),将交的基扩充为 (V_1) 的基:(\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_m)
- (\dim V_2 = n),将交的基扩充为 (V_2) 的基:(\alpha_1, \dots, \alpha_r, \beta_{r+1}, \dots, \beta_n)
我们的目标:证明向量组
[
\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_m, \beta_{r+1}, \dots, \beta_n
]
是 (V_1 + V_2) 的一组基。
如果这个结论成立,那么
[
\dim(V_1 + V_2) = r + (m - r) + (n - r) = m + n - r = \dim V_1 + \dim V_2 - \dim(V_1 \cap V_2)
]
定理即得证。
第二步:证明生成性(教材中说"显然",这里补全)
要证:(V_1 + V_2 = \operatorname{span}{ \alpha_1, \dots, \alpha_m, \beta_{r+1}, \dots, \beta_n })
证明:
对任意 (\gamma \in V_1 + V_2),根据和的定义,存在 (\alpha \in V_1) 和 (\beta \in V_2),使得 (\gamma = \alpha + \beta)。
- 因为 (\alpha \in V_1),所以 (\alpha) 可以表示为 (V_1) 基的线性组合:
[\alpha = \lambda_1\alpha_1 + \dots + \lambda_r\alpha_r + \lambda_{r+1}\alpha_{r+1} + \dots + \lambda_m\alpha_m] - 因为 (\beta \in V_2),所以 (\beta) 可以表示为 (V_2) 基的线性组合:
[\beta = \mu_1\alpha_1 + \dots + \mu_r\alpha_r + \mu_{r+1}\beta_{r+1} + \dots + \mu_n\beta_n]
因此
[
\begin{align}
\gamma &= \alpha + \beta \
&= (\lambda_1 + \mu_1)\alpha_1 + \dots + (\lambda_r + \mu_r)\alpha_r + \lambda_{r+1}\alpha_{r+1} + \dots + \lambda_m\alpha_m + \mu_{r+1}\beta_{r+1} + \dots + \mu_n\beta_n
\end{align}
]
这说明 (\gamma) 可以表示为我们构造的向量组的线性组合,故生成性成立。
第三步:证明线性无关性(证明的难点)
要证:向量组 (\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_m, \beta_{r+1}, \dots, \beta_n) 线性无关。
证明:
设有数 (\lambda_1, \dots, \lambda_m, \mu_{r+1}, \dots, \mu_n \in F),使得
[
\lambda_1\alpha_1 + \dots + \lambda_r\alpha_r + \lambda_{r+1}\alpha_{r+1} + \dots + \lambda_m\alpha_m + \mu_{r+1}\beta_{r+1} + \dots + \mu_n\beta_n = 0 \tag{*}
]
将等式左边的前 (m) 项移到右边,得
[
\lambda_1\alpha_1 + \dots + \lambda_m\alpha_m = -\mu_{r+1}\beta_{r+1} - \dots - \mu_n\beta_n \tag{**}
]
关键观察:
- 等式左边是 (V_1) 中基的线性组合,因此属于 (V_1)
- 等式右边是 (V_2) 中基的线性组合,因此属于 (V_2)
因此,这个向量同时属于 (V_1) 和 (V_2),即属于它们的交 (V_1 \cap V_2)。
因为 (V_1 \cap V_2) 的基是 (\alpha_1, \dots, \alpha_r),所以这个向量可以表示为交的基的线性组合,即存在数 (\nu_1, \dots, \nu_r \in F),使得
[
-\mu_{r+1}\beta_{r+1} - \dots - \mu_n\beta_n = \nu_1\alpha_1 + \dots + \nu_r\alpha_r
]
移项得
[
\nu_1\alpha_1 + \dots + \nu_r\alpha_r + \mu_{r+1}\beta_{r+1} + \dots + \mu_n\beta_n = 0 \tag{***}
]
现在,注意到 (\alpha_1, \dots, \alpha_r, \beta_{r+1}, \dots, \beta_n) 是 (V_2) 的一组基,因此它们线性无关。所以等式(***)中所有系数都必须为零:
[
\nu_1 = \dots = \nu_r = 0, \quad \mu_{r+1} = \dots = \mu_n = 0
]
将 (\mu_{r+1} = \dots = \mu_n = 0) 代入原等式(*),得
[
\lambda_1\alpha_1 + \dots + \lambda_r\alpha_r + \lambda_{r+1}\alpha_{r+1} + \dots + \lambda_m\alpha_m = 0
]
又因为 (\alpha_1, \dots, \alpha_m) 是 (V_1) 的一组基,线性无关,所以
[
\lambda_1 = \dots = \lambda_m = 0
]
综上,等式(*)中所有系数都为零,因此我们构造的向量组线性无关。
第四步:结论
我们构造的向量组既生成 (V_1 + V_2),又线性无关,因此是 (V_1 + V_2) 的一组基。故
[
\dim(V_1 + V_2) = m + n - r = \dim V_1 + \dim V_2 - \dim(V_1 \cap V_2)
]
定理得证。□
三、几何直观例子
例1:三维空间中的两个平面
- (V_1 = \text{xOy平面}),(\dim V_1 = 2)
- (V_2 = \text{xOz平面}),(\dim V_2 = 2)
- (V_1 \cap V_2 = \text{x轴}),(\dim(V_1 \cap V_2) = 1)
- (V_1 + V_2 = \mathbb{R}^3),(\dim(V_1 + V_2) = 3)
代入维数公式:(3 = 2 + 2 - 1),验证成立。
例2:三维空间中的直线与平面
- (V_1 = \text{x轴}),(\dim V_1 = 1)
- (V_2 = \text{yOz平面}),(\dim V_2 = 2)
- (V_1 \cap V_2 = {0}),(\dim(V_1 \cap V_2) = 0)
- (V_1 + V_2 = \mathbb{R}^3),(\dim(V_1 + V_2) = 3)
代入维数公式:(3 = 1 + 2 - 0),验证成立。
四、重要推论
推论:设 (V_1, V_2) 是 (n) 维线性空间 (V) 的两个子空间,若 (\dim V_1 + \dim V_2 > n),则 (V_1 \cap V_2 \neq {0})。
证明:由维数公式
[
\dim(V_1 \cap V_2) = \dim V_1 + \dim V_2 - \dim(V_1 + V_2) \geq \dim V_1 + \dim V_2 - n > 0
]
因此 (V_1 \cap V_2) 是非平凡子空间,即存在非零向量属于它们的交。
应用:在 (\mathbb{R}^3) 中,任意两个平面的交至少是一条直线(维数≥1),不可能只交于原点。
五、直和的等价条件
维数公式的一个最重要的特例是直和。当 (V_1 \cap V_2 = {0}) 时,(\dim(V_1 \cap V_2) = 0),此时维数公式变为
[
\dim(V_1 + V_2) = \dim V_1 + \dim V_2
]
这正是直和的等价条件之一。
六、常见应用场景
- 计算子空间的交或和的维数:已知三个维数中的任意两个,可以求出第三个。
- 证明子空间的直和分解:通过证明维数之和等于和的维数,来证明直和。
- 证明存在非零公共向量:利用推论,当两个子空间的维数之和大于整个空间的维数时,它们一定有非零公共向量。
这是线性空间结构理论中最核心的概念之一——直和。直和是子空间和的一种特殊情况,它意味着线性空间可以被"无重叠"地分解为若干个子空间的和,是后续所有空间分解理论(如特征子空间分解、若尔当分解)的基础。下面我将为你深入解析直和的本质,严格证明例5.18,并补充教材中省略的直和等价条件(这是考试和证明中最常用的内容)。
一、直和的定义与本质
定义5.11:设 (W = W_1 + W_2) 是子空间 (W_1) 与 (W_2) 的和。若 (W) 中每个元素 (\alpha) 表示为 (W_1) 中一个元素与 (W_2) 中一个元素之和的方法是唯一的,即若
[
\alpha = \alpha_1 + \alpha_2 = \beta_1 + \beta_2 \quad (\alpha_1, \beta_1 \in W_1; \alpha_2, \beta_2 \in W_2)
]
必有 (\alpha_1 = \beta_1) 且 (\alpha_2 = \beta_2),则称 (W) 是 (W_1) 与 (W_2) 的直和(或内直和),记作
[
W = W_1 \oplus W_2
]
直和的本质:无重叠分解
直和与普通和的根本区别在于是否有重叠:
- 普通和:子空间 (W_1) 和 (W_2) 可以有非零的公共部分(即 (W_1 \cap W_2 \neq {0})),因此向量的表示方法不唯一。
- 直和:子空间 (W_1) 和 (W_2) 除了零向量外没有其他公共部分(即 (W_1 \cap W_2 = {0})),因此向量的表示方法唯一。
二、例5.18的严格证明
例5.18:设 (\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n) 是线性空间 (V) 的一组基,令
[
W_1 = \operatorname{span}{\varepsilon_1, \dots, \varepsilon_s}, \quad W_2 = \operatorname{span}{\varepsilon_{s+1}, \dots, \varepsilon_n}
]
则 (V = W_1 \oplus W_2)。
证明:我们需要证明两点:(1) (V = W_1 + W_2);(2) 表示方法唯一。
1. 证明 (V = W_1 + W_2)
- (W_1 + W_2 \subseteq V):因为 (W_1) 和 (W_2) 都是 (V) 的子空间,所以它们的和也是 (V) 的子空间。
- (V \subseteq W_1 + W_2):对任意 (\alpha \in V),因为 (\varepsilon_1, \dots, \varepsilon_n) 是基,所以 (\alpha) 可以唯一表示为
[
\alpha = a_1\varepsilon_1 + \dots + a_s\varepsilon_s + a_{s+1}\varepsilon_{s+1} + \dots + a_n\varepsilon_n
]
令 (\alpha_1 = a_1\varepsilon_1 + \dots + a_s\varepsilon_s \in W_1),(\alpha_2 = a_{s+1}\varepsilon_{s+1} + \dots + a_n\varepsilon_n \in W_2),则 (\alpha = \alpha_1 + \alpha_2),故 (\alpha \in W_1 + W_2)。
因此 (V = W_1 + W_2)。
2. 证明表示方法唯一
设有两种表示:
[
\alpha = \alpha_1 + \alpha_2 = \beta_1 + \beta_2 \quad (\alpha_1, \beta_1 \in W_1; \alpha_2, \beta_2 \in W_2)
]
则
[
\alpha_1 - \beta_1 = \beta_2 - \alpha_2
]
左边属于 (W_1),右边属于 (W_2),因此这个向量属于 (W_1 \cap W_2)。
现在证明 (W_1 \cap W_2 = {0}):
设 (\gamma \in W_1 \cap W_2),则 (\gamma) 可以表示为 (W_1) 基的线性组合,也可以表示为 (W_2) 基的线性组合:
[
\gamma = c_1\varepsilon_1 + \dots + c_s\varepsilon_s = d_{s+1}\varepsilon_{s+1} + \dots + d_n\varepsilon_n
]
移项得
[
c_1\varepsilon_1 + \dots + c_s\varepsilon_s - d_{s+1}\varepsilon_{s+1} - \dots - d_n\varepsilon_n = 0
]
因为 (\varepsilon_1, \dots, \varepsilon_n) 是基,线性无关,所以所有系数都为零:
[
c_1 = \dots = c_s = d_{s+1} = \dots = d_n = 0
]
故 (\gamma = 0),即 (W_1 \cap W_2 = {0})。
因此 (\alpha_1 - \beta_1 = 0) 且 (\beta_2 - \alpha_2 = 0),即 (\alpha_1 = \beta_1) 且 (\alpha_2 = \beta_2),表示方法唯一。
综上,(V = W_1 \oplus W_2)。□
三、直和的等价条件(核心考点)
教材中只给出了直和的原始定义,但在实际证明中,我们更常用以下等价条件。
定理:设 (W_1, W_2) 是线性空间 (V) 的子空间,则以下条件等价:
- (W_1 + W_2) 是直和(即表示方法唯一)
- 零向量的表示方法唯一,即若 (0 = \alpha_1 + \alpha_2)((\alpha_1 \in W_1, \alpha_2 \in W_2)),则 (\alpha_1 = 0) 且 (\alpha_2 = 0)
- (W_1 \cap W_2 = {0})
- (\dim(W_1 + W_2) = \dim W_1 + \dim W_2)
证明(等价性):
- 1 ⇒ 2:显然,因为零向量也是 (W_1 + W_2) 中的元素,它的表示方法唯一。
- 2 ⇒ 3:设 (\alpha \in W_1 \cap W_2),则 (0 = \alpha + (-\alpha)),其中 (\alpha \in W_1),(-\alpha \in W_2)。由条件2,(\alpha = 0),故 (W_1 \cap W_2 = {0})。
- 3 ⇒ 4:由维数公式 (\dim(W_1 + W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)),代入 (\dim(W_1 \cap W_2) = 0) 即得。
- 4 ⇒ 1:设 (\alpha = \alpha_1 + \alpha_2 = \beta_1 + \beta_2),则 (\alpha_1 - \beta_1 = \beta_2 - \alpha_2 \in W_1 \cap W_2)。由维数公式,(\dim(W_1 \cap W_2) = \dim W_1 + \dim W_2 - \dim(W_1 + W_2) = 0),故 (W_1 \cap W_2 = {0}),因此 (\alpha_1 - \beta_1 = 0) 且 (\beta_2 - \alpha_2 = 0),表示方法唯一。
记忆口诀:直和等价于交为零,等价于维数相加
四、几何直观例子
例1:三维空间的直和分解
- (W_1 = \text{x轴} = \operatorname{span}{(1,0,0)})
- (W_2 = \text{yOz平面} = \operatorname{span}{(0,1,0), (0,0,1)})
则:
- (W_1 \cap W_2 = {0})
- (\dim W_1 + \dim W_2 = 1 + 2 = 3 = \dim \mathbb{R}^3)
- 任意向量 ((x,y,z) = (x,0,0) + (0,y,z)),表示方法唯一
因此 (\mathbb{R}^3 = W_1 \oplus W_2)。
例2:非直和的反例
- (W_1 = \text{xOy平面} = \operatorname{span}{(1,0,0), (0,1,0)})
- (W_2 = \text{xOz平面} = \operatorname{span}{(1,0,0), (0,0,1)})
则:
- (W_1 \cap W_2 = \text{x轴} \neq {0})
- (\dim W_1 + \dim W_2 = 2 + 2 = 4 \neq 3 = \dim(W_1 + W_2))
- 向量 ((1,1,1)) 可以表示为 ((1,1,0) + (0,0,1)),也可以表示为 ((1,0,0) + (0,1,1)),表示方法不唯一
因此 (W_1 + W_2) 不是直和。
五、常见误区提醒
- 直和不是"不交":子空间的交至少包含零向量,直和要求交恰好是零子空间,而不是空集。
- 维数相加只是必要条件吗?:对于有限维空间,维数相加是直和的充要条件;但对于无限维空间,维数相加只是必要条件,不是充分条件。
- 直和的顺序无关:(W_1 \oplus W_2 = W_2 \oplus W_1),因为交和和的运算都是交换的。
六、直和的理论意义
直和是线性代数中最重要的分解工具,它的意义在于:
- 化整为零:将复杂的线性空间分解为若干个简单的子空间的直和,从而将整个空间的问题转化为各个子空间的问题。
- 简化计算:在直和分解下,线性变换可以表示为分块对角矩阵,大大简化了矩阵的运算。
- 揭示结构:后续的特征子空间分解、若尔当分解等都是直和分解的具体应用,它们揭示了线性变换的本质结构。
这是两个子空间直和概念向多个子空间的自然推广,也是线性空间分解理论的核心内容。多个子空间的直和与两个子空间的直和有一个极其重要的区别,也是考试中最容易出错的地方——两两交为零不足以保证是直和。下面我将为你深入解析多个子空间直和的定义与等价条件,通过经典反例澄清最常见的误区,并补充教材省略的证明思路。
一、补子空间的概念
在进入多个子空间直和之前,我们先补充一个重要概念:
定义:若线性空间 (V = W \oplus U),则称 (U) 是 (W) 在 (V) 中的补子空间。
关键性质:补子空间不唯一。
反例:在 (\mathbb{R}^2) 中,设 (W = \operatorname{span}{(1,0)})(x轴),则任何过原点且不与x轴重合的直线都是 (W) 的补子空间,例如:
- (U_1 = \operatorname{span}{(0,1)})(y轴)
- (U_2 = \operatorname{span}{(1,1)})(直线y=x)
- (U_3 = \operatorname{span}{(1,2)})(直线y=2x)
它们都满足 (V = W \oplus U_i),因此补子空间有无穷多个。
二、多个子空间直和的定义
定义5.12:设 (W_1, W_2, \dots, W_s) 是线性空间 (V) 的子空间,它们的和为
[
W = W_1 + W_2 + \dots + W_s
]
若 (W) 中每个元素 (\alpha) 表示为各子空间中元素之和的方法是唯一的,即若
[
\alpha = \alpha_1 + \alpha_2 + \dots + \alpha_s = \beta_1 + \beta_2 + \dots + \beta_s \quad (\alpha_i, \beta_i \in W_i)
]
必有 (\alpha_i = \beta_i) 对所有 (i = 1, 2, \dots, s) 成立,则称 (W) 是 (W_1, W_2, \dots, W_s) 的直和,记作
[
W = W_1 \oplus W_2 \oplus \dots \oplus W_s = \bigoplus_{i=1}^s W_i
]
三、多个子空间直和的等价条件(定理5.5)
定理5.5:设 (W_1, W_2, \dots, W_s) 是线性空间 (V) 的子空间,(W = W_1 + W_2 + \dots + W_s),则以下四个断言等价:
- (W = W_1 \oplus W_2 \oplus \dots \oplus W_s)(表示方法唯一)
- 零向量的表示方法唯一,即若 (0 = \alpha_1 + \alpha_2 + \dots + \alpha_s)((\alpha_i \in W_i)),则 (\alpha_1 = \alpha_2 = \dots = \alpha_s = 0)
- 对任意 (i = 1, 2, \dots, s),有 (W_i \cap \left( \sum_{j \neq i} W_j \right) = {0})
- (\dim W = \sum_{i=1}^s \dim W_i)
最关键的区别与误区
90%的学生都会在这里犯错:对于多个子空间的直和,两两交为零是不够的!
- 两个子空间:(W_1 \cap W_2 = {0}) 是直和的充要条件
- 三个及以上子空间:(W_i \cap W_j = {0}) 对所有 (i \neq j) 成立,不能推出是直和
经典反例:在 (\mathbb{R}^3) 中,设
- (W_1 = \operatorname{span}{(1,0,0)})(x轴)
- (W_2 = \operatorname{span}{(0,1,0)})(y轴)
- (W_3 = \operatorname{span}{(1,1,0)})(直线x=y, z=0)
则:
- 两两交为零:(W_1 \cap W_2 = W_1 \cap W_3 = W_2 \cap W_3 = {0})
- 但 (W_3 \cap (W_1 + W_2) = W_3 \cap \text{xOy平面} = W_3 \neq {0}),违反条件(3)
- 维数:(\dim W_1 + \dim W_2 + \dim W_3 = 1+1+1=3),但 (\dim(W_1+W_2+W_3) = \dim(\text{xOy平面}) = 2 \neq 3),违反条件(4)
- 零向量表示不唯一:(0 = 1 \cdot (1,0,0) + 1 \cdot (0,1,0) + (-1) \cdot (1,1,0)),违反条件(2)
因此 (W_1 + W_2 + W_3) 不是直和。
结论:多个子空间直和要求每个子空间与其他所有子空间的和没有公共非零向量,而不仅仅是两两之间没有公共非零向量。
四、定理5.5的证明思路
教材说"证明与s=2时类似",下面我为你补充完整的证明逻辑链条:
1. (1) ⇒ (2)
显然,零向量也是 (W) 中的元素,它的表示方法唯一,只能是 (0 = 0 + 0 + \dots + 0)。
2. (2) ⇒ (3)
设 (\alpha \in W_i \cap \left( \sum_{j \neq i} W_j \right)),则 (\alpha) 可以表示为:
[
\alpha = \alpha_i = \sum_{j \neq i} \alpha_j \quad (\alpha_i \in W_i, \alpha_j \in W_j)
]
移项得:
[
\sum_{j \neq i} \alpha_j - \alpha_i = 0
]
由条件(2)(零向量表示唯一),所有系数都必须为零,因此 (\alpha_i = 0),即 (\alpha = 0)。故 (W_i \cap \left( \sum_{j \neq i} W_j \right) = {0})。
3. (3) ⇒ (4)
用数学归纳法证明:
- 基例(s=2):由维数公式,(\dim(W_1+W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2) = \dim W_1 + \dim W_2),成立。
- 归纳假设:假设对于s-1个子空间结论成立。
- 归纳步骤:对于s个子空间,有
[
\begin{align}
\dim\left( \sum_{i=1}^s W_i \right) &= \dim\left( \sum_{i=1}^{s-1} W_i + W_s \right) \
&= \dim\left( \sum_{i=1}^{s-1} W_i \right) + \dim W_s - \dim\left( \sum_{i=1}^{s-1} W_i \cap W_s \right)
\end{align}
]
由条件(3),(\sum_{i=1}^{s-1} W_i \cap W_s = {0}),故 (\dim\left( \sum_{i=1}^{s-1} W_i \cap W_s \right) = 0)。
由归纳假设,(\dim\left( \sum_{i=1}^{s-1} W_i \right) = \sum_{i=1}^{s-1} \dim W_i)。
因此:
[
\dim\left( \sum_{i=1}^s W_i \right) = \sum_{i=1}^{s-1} \dim W_i + \dim W_s = \sum_{i=1}^s \dim W_i
]
4. (4) ⇒ (1)
用反证法。假设表示方法不唯一,则存在两种不同的表示:
[
\alpha = \alpha_1 + \dots + \alpha_s = \beta_1 + \dots + \beta_s
]
移项得:
[
(\alpha_1 - \beta_1) + \dots + (\alpha_s - \beta_s) = 0
]
因为表示方法不同,至少有一个 (\alpha_i - \beta_i \neq 0)。不妨设 (\alpha_1 - \beta_1 \neq 0),则:
[
\alpha_1 - \beta_1 = -(\alpha_2 - \beta_2) - \dots - (\alpha_s - \beta_s)
]
这说明 (\alpha_1 - \beta_1 \in W_1 \cap \left( \sum_{j=2}^s W_j \right)),且 (\alpha_1 - \beta_1 \neq 0),因此 (\dim\left( W_1 \cap \left( \sum_{j=2}^s W_j \right) \right) \geq 1)。
由维数公式:
[
\dim W = \dim W_1 + \dim\left( \sum_{j=2}^s W_j \right) - \dim\left( W_1 \cap \left( \sum_{j=2}^s W_j \right) \right) < \dim W_1 + \dim\left( \sum_{j=2}^s W_j \right)
]
重复这个过程,最终会得到 (\dim W < \sum_{i=1}^s \dim W_i),与条件(4)矛盾。因此表示方法唯一,即 (W) 是直和。
五、相互线性独立的子空间
满足定理5.5中任一条件的子空间 (W_1, \dots, W_s) 称为相互线性独立的。
重要性质:若子空间 (W_1, \dots, W_s) 相互线性独立,则从每个 (W_i) 中任取一组线性无关的向量,将它们合在一起得到的向量组仍然线性无关。
应用:直和的基可以由各子空间的基拼接而成。即若 (B_i) 是 (W_i) 的一组基,则 (B = B_1 \cup B_2 \cup \dots \cup B_s) 是 (\bigoplus_{i=1}^s W_i) 的一组基。
六、常见误区总结
- 多个子空间直和的条件错误:不要以为两两交为零就够了,必须是每个子空间与其余子空间的和的交为零。
- 补子空间唯一性错误:补子空间不唯一,有无穷多个。
- 无限维空间的推广:维数相加是有限维空间直和的充要条件,在无限维空间中不成立。
这是线性空间构造理论的核心定理,它定义了外直和——一种从两个已知线性空间构造新线性空间的标准方法。教材中很多地方写得比较简略,下面我将为你补全所有证明细节,并重点澄清外直和与内直和的本质区别与联系,这是线性代数中最容易混淆的概念之一。
一、外直和的定义
定理5.6:设 (V_1) 和 (V_2) 是域 (F) 上的两个线性空间,定义集合
[
V = { (\alpha, \beta) \mid \alpha \in V_1, \beta \in V_2 }
]
并在 (V) 上定义加法和数乘运算:
- 加法:((\alpha_1, \beta_1) + (\alpha_2, \beta_2) = (\alpha_1 + \alpha_2, \beta_1 + \beta_2))
- 数乘:(\lambda (\alpha, \beta) = (\lambda \alpha, \lambda \beta)),其中 (\lambda \in F)
则 (V) 是域 (F) 上的线性空间,称为 (V_1) 与 (V_2) 的外直和,记作 (V = V_1 \oplus V_2)。
二、完整证明过程
1. 证明 (V) 是线性空间(教材省略的细节)
要证明一个集合是线性空间,需要验证8条公理:
- 加法交换律:((\alpha_1, \beta_1) + (\alpha_2, \beta_2) = (\alpha_1+\alpha_2, \beta_1+\beta_2) = (\alpha_2+\alpha_1, \beta_2+\beta_1) = (\alpha_2, \beta_2) + (\alpha_1, \beta_1))
- 加法结合律:([(\alpha_1, \beta_1) + (\alpha_2, \beta_2)] + (\alpha_3, \beta_3) = (\alpha_1+\alpha_2+\alpha_3, \beta_1+\beta_2+\beta_3) = (\alpha_1, \beta_1) + [(\alpha_2, \beta_2) + (\alpha_3, \beta_3)])
- 零元素存在:(0 = (0_{V_1}, 0_{V_2})),满足 ((\alpha, \beta) + (0, 0) = (\alpha, \beta))
- 负元素存在:对任意 ((\alpha, \beta)),其负元素为 ((-\alpha, -\beta)),满足 ((\alpha, \beta) + (-\alpha, -\beta) = (0, 0))
- 数乘单位元:(1 \cdot (\alpha, \beta) = (1 \cdot \alpha, 1 \cdot \beta) = (\alpha, \beta))
- 数乘结合律:(\lambda (\mu (\alpha, \beta)) = \lambda (\mu \alpha, \mu \beta) = (\lambda \mu \alpha, \lambda \mu \beta) = (\lambda \mu) (\alpha, \beta))
- 数乘对加法的分配律1:(\lambda [(\alpha_1, \beta_1) + (\alpha_2, \beta_2)] = \lambda (\alpha_1+\alpha_2, \beta_1+\beta_2) = (\lambda \alpha_1+\lambda \alpha_2, \lambda \beta_1+\lambda \beta_2) = \lambda (\alpha_1, \beta_1) + \lambda (\alpha_2, \beta_2))
- 数乘对加法的分配律2:((\lambda + \mu) (\alpha, \beta) = ((\lambda+\mu)\alpha, (\lambda+\mu)\beta) = (\lambda \alpha + \mu \alpha, \lambda \beta + \mu \beta) = \lambda (\alpha, \beta) + \mu (\alpha, \beta))
所有公理都满足,因此 (V) 是线性空间。□
2. 证明基的结论
定理:若 (\alpha_1, \dots, \alpha_m) 是 (V_1) 的基,(\beta_1, \dots, \beta_n) 是 (V_2) 的基,则
[
(\alpha_1, 0), \dots, (\alpha_m, 0), (0, \beta_1), \dots, (0, \beta_n)
]
是 (V) 的基。
证明:需要证明两点:生成性和线性无关性。
(1) 生成性
对任意 ((\alpha, \beta) \in V),因为 (\alpha_1, \dots, \alpha_m) 是 (V_1) 的基,所以存在数 (\lambda_1, \dots, \lambda_m \in F),使得
[
\alpha = \lambda_1 \alpha_1 + \dots + \lambda_m \alpha_m
]
同理,因为 (\beta_1, \dots, \beta_n) 是 (V_2) 的基,所以存在数 (\mu_1, \dots, \mu_n \in F),使得
[
\beta = \mu_1 \beta_1 + \dots + \mu_n \beta_n
]
因此
[
\begin{align}
(\alpha, \beta) &= (\lambda_1 \alpha_1 + \dots + \lambda_m \alpha_m, \mu_1 \beta_1 + \dots + \mu_n \beta_n) \
&= \lambda_1 (\alpha_1, 0) + \dots + \lambda_m (\alpha_m, 0) + \mu_1 (0, \beta_1) + \dots + \mu_n (0, \beta_n)
\end{align}
]
这说明 (V) 中任意元素都可以表示为该向量组的线性组合,故生成性成立。
(2) 线性无关性
设有数 (\lambda_1, \dots, \lambda_m, \mu_1, \dots, \mu_n \in F),使得
[
\lambda_1 (\alpha_1, 0) + \dots + \lambda_m (\alpha_m, 0) + \mu_1 (0, \beta_1) + \dots + \mu_n (0, \beta_n) = (0, 0)
]
根据外直和的运算定义,左边等于
[
(\lambda_1 \alpha_1 + \dots + \lambda_m \alpha_m, \mu_1 \beta_1 + \dots + \mu_n \beta_n) = (0, 0)
]
外直和中两个元素相等当且仅当它们的对应分量都相等,因此
[
\lambda_1 \alpha_1 + \dots + \lambda_m \alpha_m = 0_{V_1}, \quad \mu_1 \beta_1 + \dots + \mu_n \beta_n = 0_{V_2}
]
因为 (\alpha_1, \dots, \alpha_m) 是 (V_1) 的基,线性无关,所以 (\lambda_1 = \dots = \lambda_m = 0)。
因为 (\beta_1, \dots, \beta_n) 是 (V_2) 的基,线性无关,所以 (\mu_1 = \dots = \mu_n = 0)。
因此该向量组线性无关。
综上,该向量组是 (V) 的基。□
3. 维数公式
由基的结论,(V) 的基中有 (m + n) 个向量,因此
[
\dim(V) = m + n = \dim(V_1) + \dim(V_2)
]
三、外直和与内直和的本质联系(注记详解)
这是整个定理最核心的部分,也是最容易混淆的地方。
1. 构造自然同构
在外直和 (V = V_1 \oplus V_2) 中,定义两个子集:
[
W_1 = { (\alpha, 0) \mid \alpha \in V_1 }, \quad W_2 = { (0, \beta) \mid \beta \in V_2 }
]
性质:
- (W_1) 和 (W_2) 都是 (V) 的子空间。
- 存在自然同构:(W_1 \cong V_1)(映射 ((\alpha, 0) \mapsto \alpha)),(W_2 \cong V_2)(映射 ((0, \beta) \mapsto \beta))。
- (V = W_1 \oplus W_2)(内直和)。
证明 (V = W_1 \oplus W_2):
- 显然 (V = W_1 + W_2),因为任意 ((\alpha, \beta) = (\alpha, 0) + (0, \beta))。
- (W_1 \cap W_2 = { (0, 0) }),因为若 ((\alpha, 0) = (0, \beta)),则 (\alpha = 0) 且 (\beta = 0)。
因此 (V) 是 (W_1) 和 (W_2) 的内直和。□
2. 本质结论
外直和与内直和没有本质区别:
- 外直和:是构造性的,从两个独立的线性空间"拼"出一个新的线性空间。
- 内直和:是分解性的,将一个已有的线性空间"拆"成两个子空间的和。
但从代数结构的角度看,它们是完全一样的。任何外直和都可以看作是它的两个"分量子空间"的内直和;任何内直和 (V = W_1 \oplus W_2) 都与外直和 (W_1 \oplus W_2) 同构。
四、外直和与内直和的对比表
为了更清晰地理解两者的区别,我们用表格总结:
| 内直和 | 外直和 | |
|---|---|---|
| 前提 | (W_1, W_2) 是同一个大空间 (V) 的子空间 | (V_1, V_2) 是两个独立的线性空间 |
| 元素 | 是 (V) 中的元素 | 是有序对 ((\alpha, \beta)),其中 (\alpha \in V_1, \beta \in V_2) |
| 运算 | 继承大空间 (V) 的运算 | 按分量定义运算 |
| 本质 | 分解已有空间 | 构造新空间 |
| 关系 | 任何内直和都同构于外直和 | 任何外直和都包含内直和结构 |
五、典型例子
例1:二维实空间
- 外直和:(\mathbb{R} \oplus \mathbb{R} = { (x, y) \mid x, y \in \mathbb{R} }),这就是我们熟悉的二维实空间 (\mathbb{R}^2)。
- 内直和:(\mathbb{R}^2 = \operatorname{span}{(1,0)} \oplus \operatorname{span}{(0,1)}),即x轴和y轴的内直和。
例2:矩阵空间
- (M_{m \times n}(F)) 可以看作是 (M_{m \times k}(F)) 和 (M_{m \times (n-k)}(F)) 的外直和,对应矩阵的分块:
[
\begin{pmatrix} A & B \end{pmatrix} \leftrightarrow (A, B)
]
其中 (A \in M_{m \times k}(F)),(B \in M_{m \times (n-k)}(F))。
例3:多项式空间
- (F[x]_n)(次数小于n的多项式空间)可以看作是 (F[x]k) 和 (x^k F[x]) 的外直和,对应多项式的分解:
[
f(x) = f_1(x) + x^k f_2(x)
]
其中 (f_1(x) \in F[x]k),(f_2(x) \in F[x])。
六、推广到多个线性空间
外直和的概念可以直接推广到任意有限多个线性空间的情况:
设 (V_1, V_2, \dots, V_s) 是域 (F) 上的线性空间,它们的外直和定义为
[
V_1 \oplus V_2 \oplus \dots \oplus V_s = { (\alpha_1, \alpha_2, \dots, \alpha_s) \mid \alpha_i \in V_i }
]
运算按分量进行,维数公式为
[
\dim(V_1 \oplus \dots \oplus V_s) = \dim V_1 + \dots + \dim V_s
]
七、理论意义
外直和是线性代数中最重要的构造工具之一,它的意义在于:
- 提供了构造新线性空间的标准方法:从已知的简单线性空间可以构造出复杂的线性空间。
- 统一了构造与分解的观点:证明了任何直和,无论是构造出来的还是分解出来的,在代数结构上都是等价的。
- 为后续理论奠定基础:模的直和、群的直积、拓扑空间的乘积等概念都是外直和思想的推广。
这是外直和最直观、最常用的经典实例,它清晰地展示了如何通过拼接低维数组空间得到高维数组空间,也是我们通常将 (F^m \oplus F^n) 直接等同于 (F^{m+n}) 的理论依据。下面我将为你严格证明这个同构关系,并结合基的构造和具体数值例子进行深入解析。
一、例5.19完整表述与严格证明
例5.19:设 (V_1 = F^m)(m元行向量空间),(V_2 = F^n)(n元行向量空间),则它们的外直和
[
V_1 \oplus V_2 \cong F^{m+n}
]
(注:教材中写的“=”是同构意义下的相等,因为作为集合它们的元素形式不同,但作为线性空间结构完全一致。)
1. 构造同构映射
定义映射 (\varphi: V_1 \oplus V_2 \rightarrow F^{m+n}),将外直和中的有序对按顺序拼接成一个长向量:
[
\varphi\left( (a_1, a_2, \dots, a_m), (b_1, b_2, \dots, b_n) \right) = (a_1, a_2, \dots, a_m, b_1, b_2, \dots, b_n)
]
2. 证明 (\varphi) 是线性同构
要证明一个映射是线性同构,需要验证三点:线性性、单射性、满射性。
(1) 线性性
对任意 ((\alpha_1, \beta_1), (\alpha_2, \beta_2) \in V_1 \oplus V_2) 和任意 (\lambda \in F):
- 加法保持性:
[
\begin{align}
\varphi\left( (\alpha_1, \beta_1) + (\alpha_2, \beta_2) \right) &= \varphi\left( (\alpha_1+\alpha_2, \beta_1+\beta_2) \right) \
&= (\alpha_1+\alpha_2, \beta_1+\beta_2) \quad \text{(拼接成长向量)} \
&= (\alpha_1, \beta_1) + (\alpha_2, \beta_2) \quad \text{(长向量加法)} \
&= \varphi\left( (\alpha_1, \beta_1) \right) + \varphi\left( (\alpha_2, \beta_2) \right)
\end{align}
] - 数乘保持性:
[
\begin{align}
\varphi\left( \lambda (\alpha, \beta) \right) &= \varphi\left( (\lambda \alpha, \lambda \beta) \right) \
&= (\lambda \alpha, \lambda \beta) \quad \text{(拼接成长向量)} \
&= \lambda (\alpha, \beta) \quad \text{(长向量数乘)} \
&= \lambda \varphi\left( (\alpha, \beta) \right)
\end{align}
]
因此 (\varphi) 是线性映射。
(2) 单射性
假设 (\varphi\left( (\alpha, \beta) \right) = \varphi\left( (\alpha', \beta') \right)),即
[
(\alpha, \beta){\text{拼接}} = (\alpha', \beta'){\text{拼接}}
]
两个向量相等当且仅当对应分量都相等,因此前m个分量相等得 (\alpha = \alpha'),后n个分量相等得 (\beta = \beta'),故 ((\alpha, \beta) = (\alpha', \beta'))。
因此 (\varphi) 是单射。
(3) 满射性
对任意长向量 (\gamma = (c_1, c_2, \dots, c_{m+n}) \in F^{m+n}),将其拆分为前m个分量和后n个分量:
[
\alpha = (c_1, c_2, \dots, c_m) \in F^m, \quad \beta = (c_{m+1}, c_{m+2}, \dots, c_{m+n}) \in F^n
]
则 (\varphi\left( (\alpha, \beta) \right) = \gamma),即对任意 (F^{m+n}) 中的元素,都存在原像。
因此 (\varphi) 是满射。
3. 结论
(\varphi) 是双射线性映射,即线性同构,故
[
V_1 \oplus V_2 \cong F^{m+n}
]
二、从基的角度验证
根据外直和的基的构造定理:
- (V_1 = F^m) 的标准基为 (\varepsilon_1=(1,0,\dots,0), \varepsilon_2=(0,1,\dots,0), \dots, \varepsilon_m=(0,\dots,1))
- (V_2 = F^n) 的标准基为 (\eta_1=(1,0,\dots,0), \eta_2=(0,1,\dots,0), \dots, \eta_n=(0,\dots,1))
则 (V_1 \oplus V_2) 的基为:
[
(\varepsilon_1, 0), (\varepsilon_2, 0), \dots, (\varepsilon_m, 0), (0, \eta_1), (0, \eta_2), \dots, (0, \eta_n)
]
现在看这些基向量在同构映射 (\varphi) 下的像:
- (\varphi\left( (\varepsilon_i, 0) \right) = (0,\dots,1,\dots,0))(第i个分量为1,其余为0),即 (F^{m+n}) 的标准基的第i个向量
- (\varphi\left( (0, \eta_j) \right) = (0,\dots,1,\dots,0))(第m+j个分量为1,其余为0),即 (F^{m+n}) 的标准基的第m+j个向量
这说明 (\varphi) 把 (V_1 \oplus V_2) 的基一一对应地映为 (F^{m+n}) 的标准基,而"把基映为基的线性映射是同构",这再次验证了我们的结论。
三、具体数值例子
取 (m=2, n=3),则 (F^2 \oplus F^3 \cong F^5)。
- 外直和元素:(((1,2), (3,4,5)) \in F^2 \oplus F^3)
- 拼接后的长向量:((1,2,3,4,5) \in F^5)
- 同构映射:(\varphi\left( ((1,2), (3,4,5)) \right) = (1,2,3,4,5))
再验证线性性:
- (\varphi\left( ((1,2), (3,4,5)) + ((-1,0), (2,-1,3)) \right) = \varphi\left( ((0,2), (5,3,8)) \right) = (0,2,5,3,8))
- (\varphi\left( ((1,2), (3,4,5)) \right) + \varphi\left( ((-1,0), (2,-1,3)) \right) = (1,2,3,4,5) + (-1,0,2,-1,3) = (0,2,5,3,8))
两者相等,线性性成立。
四、与内直和的联系
在 (F^{m+n}) 中定义两个子空间:
- (W_1 = { (a_1, \dots, a_m, 0, \dots, 0) \mid a_i \in F })(前m个分量非零)
- (W_2 = { (0, \dots, 0, b_1, \dots, b_n) \mid b_j \in F })(后n个分量非零)
则:
- (W_1 \cong F^m),(W_2 \cong F^n)(自然同构)
- (F^{m+n} = W_1 \oplus W_2)(内直和)
这再次印证了我们之前的核心结论:外直和与内直和没有本质区别。外直和是"从两个空间拼出一个新空间",内直和是"把一个空间拆成两个子空间",但它们的代数结构完全一致。
五、这个例子的重要意义
- 直观性:它是外直和最具体、最容易理解的实例,将抽象的有序对运算转化为我们熟悉的向量拼接运算。
- 基础性:几乎所有外直和的应用都建立在这个例子之上,例如分块矩阵、乘积拓扑空间、乘积群等。
- 约定俗成:正因为这个同构关系,在不引起混淆的情况下,我们通常直接将 (F^m \oplus F^n) 写作 (F^{m+n}),无需区分有序对和长向量。
这是外直和构造能力的绝佳展示,它证明了我们可以将完全不同类型的线性空间(矩阵空间和多项式空间)拼接成一个新的线性空间,而这个新空间仍然保持完整的线性结构。下面我将为你深入解析这个例子,包括维数计算、基的构造、同构关系以及具体数值演示。
一、例5.20完整解析
例5.20:设 (V_1 = M_2(F))(域F上的2阶方阵空间),(V_2 = F[x]n)(域F上次数小于n的多项式空间),则它们的外直和为
[
V = V_1 \oplus V_2 = \left{ \left( \begin{pmatrix} a & b \ c & d \end{pmatrix}, a_0 + a_1x + \dots + ax^{n-1} \right) \mid a,b,c,d,a_0,\dots,a_{n-1} \in F \right}
]
1. 维数计算
根据外直和的维数公式:
[
\dim(V) = \dim(V_1) + \dim(V_2)
]
- (M_2(F)) 是4维线性空间,基为矩阵单位组:
[
E_{11} = \begin{pmatrix} 1 & 0 \ 0 & 0 \end{pmatrix}, \quad E_{12} = \begin{pmatrix} 0 & 1 \ 0 & 0 \end{pmatrix}, \quad E_{21} = \begin{pmatrix} 0 & 0 \ 1 & 0 \end{pmatrix}, \quad E_{22} = \begin{pmatrix} 0 & 0 \ 0 & 1 \end{pmatrix}
] - (F[x]_n) 是n维线性空间,基为单项式基:
[
1, x, x^2, \dots, x^{n-1}
]
因此
[
\dim(V) = 4 + n
]
2. 外直和的基构造
根据外直和的基的构造定理,(V) 的基由 (V_1) 的基和 (V_2) 的基拼接而成:
[
(E_{11}, 0), (E_{12}, 0), (E_{21}, 0), (E_{22}, 0), (0, 1), (0, x), (0, x^2), \dots, (0, x^{n-1})
]
总共有 (4 + n) 个向量,与维数一致。
3. 与数组空间的同构
根据有限维线性空间的分类定理,任何 (4+n) 维线性空间都同构于 (F^{4+n})。我们可以构造一个自然的同构映射 (\varphi: V \rightarrow F^{4+n}),将外直和中的元素按顺序展开为一个长向量:
[
\varphi\left( \begin{pmatrix} a & b \ c & d \end{pmatrix}, a_0 + a_1x + \dots + a_{n-1}x^{n-1} \right) = (a, b, c, d, a_0, a_1, \dots, a_{n-1})
]
这个映射是双射线性映射,因此是线性同构。
二、具体数值例子(n=3)
取 (n=3),则 (V = M_2(F) \oplus F[x]_3),维数为 (4+3=7),同构于 (F^7)。
例1:元素表示
- 外直和元素:
[
\left( \begin{pmatrix} 1 & 2 \ 3 & 4 \end{pmatrix}, 5 + 6x + 7x^2 \right) \in V
] - 对应的坐标向量(在上述同构下):
[
(1, 2, 3, 4, 5, 6, 7) \in F^7
]
例2:线性运算演示
- 加法:
[
\begin{align}
&\left( \begin{pmatrix} 1 & 2 \ 3 & 4 \end{pmatrix}, 5 + 6x + 7x^2 \right) + \left( \begin{pmatrix} -1 & 0 \ 2 & -1 \end{pmatrix}, 2 - x + 3x^2 \right) \
=& \left( \begin{pmatrix} 0 & 2 \ 5 & 3 \end{pmatrix}, 7 + 5x + 10x^2 \right)
\end{align}
] - 数乘:
[
2 \cdot \left( \begin{pmatrix} 1 & 2 \ 3 & 4 \end{pmatrix}, 5 + 6x + 7x^2 \right) = \left( \begin{pmatrix} 2 & 4 \ 6 & 8 \end{pmatrix}, 10 + 12x + 14x^2 \right)
]
例3:内直和分解
在 (V) 中定义两个子空间:
- (W_1 = { (A, 0) \mid A \in M_2(F) }),同构于 (M_2(F))
- (W_2 = { (0, f(x)) \mid f(x) \in F[x]_3 }),同构于 (F[x]_3)
则 (V = W_1 \oplus W_2)(内直和),因为:
- (V = W_1 + W_2):任意元素 ((A, f(x)) = (A, 0) + (0, f(x)))
- (W_1 \cap W_2 = { (0, 0) }):若 ((A, 0) = (0, f(x))),则 (A=0) 且 (f(x)=0)
三、这个例子的核心意义
- 展示了外直和的普适性:外直和不关心原来的线性空间的元素是什么类型,无论是矩阵、多项式、函数还是其他任何线性空间的元素,都可以通过有序对的方式拼接成一个新的线性空间。
- 统一了不同类型的线性空间:通过坐标映射,我们可以将矩阵和多项式这样完全不同的对象,统一转化为数组空间中的向量来处理,这正是线性代数的强大之处。
- 为更复杂的空间构造奠定基础:在后续的数学学习中,我们会遇到更多由不同类型空间拼接而成的复杂空间,例如张量积空间、外代数空间等,外直和是这些构造的基础。
四、推广到一般情况
这个例子可以直接推广到任意两个有限维线性空间的外直和:
设 (V_1) 是m维线性空间,基为 (\alpha_1, \dots, \alpha_m);(V_2) 是n维线性空间,基为 (\beta_1, \dots, \beta_n)。则:
- (V_1 \oplus V_2) 是 (m+n) 维线性空间
- 基为 ((\alpha_1, 0), \dots, (\alpha_m, 0), (0, \beta_1), \dots, (0, \beta_n))
- 同构于 (F^{m+n})
这部分内容是直和理论的深化与推广,分为两个核心部分:一是有限直和对应的典型投影算子(这是线性变换分解理论的基石),二是将直和概念从有限维推广到无限维,并进一步推广到群和环等其他代数结构。下面我将为你逐点解析,补充所有省略的证明细节,并澄清有限直和与无限直和的本质区别。
一、典型投影算子(有限直和)
1. 投影的定义
设线性空间 (V) 是其子空间 (W_1, W_2, \dots, W_s) 的直和,即
[
V = W_1 \oplus W_2 \oplus \dots \oplus W_s
]
根据直和的定义,每个向量 (\alpha \in V) 都可以唯一地表示为
[
\alpha = \alpha_1 + \alpha_2 + \dots + \alpha_s, \quad \alpha_i \in W_i
]
对任意固定的 (i)((1 \leq i \leq s)),定义映射
[
\pi_i: V \rightarrow V, \quad \pi_i(\alpha) = \alpha_i
]
这个映射称为关于直和分解 (V = W_1 \oplus \dots \oplus W_s) 的第i个典型投影(或正则投影)。
2. 投影的核心性质与证明
投影算子满足以下四个基本性质,它们完全刻画了直和分解的特征。
(1) 像与核
- 像:(\operatorname{Im} \pi_i = W_i)
- 核:(\ker \pi_i = W_1 \oplus \dots \oplus W_{i-1} \oplus W_{i+1} \oplus \dots \oplus W_s)
证明:
- 像:对任意 (\alpha_i \in W_i),有 (\alpha_i = 0 + \dots + \alpha_i + \dots + 0),故 (\pi_i(\alpha_i) = \alpha_i),因此 (W_i \subseteq \operatorname{Im} \pi_i)。反之,对任意 (\alpha \in V),(\pi_i(\alpha) = \alpha_i \in W_i),故 (\operatorname{Im} \pi_i \subseteq W_i)。因此 (\operatorname{Im} \pi_i = W_i)。
- 核:(\pi_i(\alpha) = 0) 当且仅当 (\alpha_i = 0),即 (\alpha = \alpha_1 + \dots + \alpha_{i-1} + \alpha_{i+1} + \dots + \alpha_s),这正是 (W_1 \oplus \dots \oplus W_{i-1} \oplus W_{i+1} \oplus \dots \oplus W_s) 中的元素。因此 (\ker \pi_i = \bigoplus_{j \neq i} W_j)。
(2) 幂等性
[
\pi_i^2 = \pi_i \quad (\text{即 } \pi_i \circ \pi_i = \pi_i)
]
证明:对任意 (\alpha \in V),(\pi_i(\alpha) = \alpha_i \in W_i)。而 (\alpha_i) 在直和分解中只有第i个分量非零,因此 (\pi_i(\pi_i(\alpha)) = \pi_i(\alpha_i) = \alpha_i = \pi_i(\alpha))。故 (\pi_i^2 = \pi_i)。
(3) 正交性(i≠j时)
[
\pi_i \pi_j = 0 \quad (\text{当 } i \neq j)
]
证明:对任意 (\alpha \in V),(\pi_j(\alpha) = \alpha_j \in W_j)。而 (\alpha_j) 在直和分解中只有第j个分量非零,因此 (\pi_i(\pi_j(\alpha)) = \pi_i(\alpha_j) = 0)。故 (\pi_i \pi_j = 0)。
(4) 单位分解
[
\pi_1 + \pi_2 + \dots + \pi_s = \operatorname{id}_V
]
其中 (\operatorname{id}_V) 是V上的恒等映射。
证明:对任意 (\alpha \in V),
[
(\pi_1 + \pi_2 + \dots + \pi_s)(\alpha) = \pi_1(\alpha) + \pi_2(\alpha) + \dots + \pi_s(\alpha) = \alpha_1 + \alpha_2 + \dots + \alpha_s = \alpha
]
故 (\pi_1 + \dots + \pi_s = \operatorname{id}_V)。
3. 投影的理论意义
这四个性质是可逆的:如果线性空间V上有s个线性变换 (\pi_1, \dots, \pi_s) 满足上述四个性质,那么令 (W_i = \operatorname{Im} \pi_i),就有 (V = W_1 \oplus \dots \oplus W_s),且 (\pi_i) 就是关于这个直和分解的典型投影。
这意味着直和分解与满足上述性质的投影算子组是一一对应的。这一结论是后续线性变换谱分解、若尔当分解等理论的核心基础。
二、无限多个线性空间的直和
有限直和的概念可以推广到无限多个线性空间的情况,但这里有一个极其重要的限制,也是有限与无限的本质区别。
1. 无限外直和的定义
设 ({ V_i \mid i \in \mathbb{N} }) 是域F上的一族线性空间,它们的外直和定义为
[
\bigoplus_{i \in \mathbb{N}} V_i = \left{ (\alpha_i)_{i \in \mathbb{N}} \mid \alpha_i \in V_i, \text{ 且只有有限个 } \alpha_i \neq 0 \right}
]
加法和数乘按分量定义:
- 加法:((\alpha_i) + (\beta_i) = (\alpha_i + \beta_i))
- 数乘:(\lambda (\alpha_i) = (\lambda \alpha_i))
关键限制:只有有限个分量非零。如果去掉这个限制,允许无限个分量非零,得到的是直积 (\prod_{i \in \mathbb{N}} V_i),而不是直和。
为什么要有这个限制?
因为线性空间的加法是二元运算,只能定义有限个向量的和,无限个向量的和在一般线性空间中没有定义。如果允许无限个非零分量,那么两个这样的序列相加可能会出现无限个非零分量,这在代数上是不合法的。
2. 无限内直和的定义
设 ({ V_i \mid i \in \mathbb{N} }) 是线性空间V的一族子空间,它们的和定义为
[
\sum_{i=1}^\infty V_i = \left{ \sum_{i=1}^\infty \alpha_i \mid \alpha_i \in V_i, \text{ 且只有有限个 } \alpha_i \neq 0 \right}
]
即所有有限和的集合。
如果 (\sum_{i=1}^\infty V_i) 中每个元素的表示方法是唯一的,即若
[
\sum_{i=1}^\infty \alpha_i = \sum_{i=1}^\infty \beta_i \quad (\alpha_i, \beta_i \in V_i)
]
则对所有 (i \in \mathbb{N}),有 (\alpha_i = \beta_i),那么称这个和为内直和,记作
[
\bigoplus_{i=1}^\infty V_i
]
3. 无限内直和的等价条件
[
\sum_{i=1}^\infty V_i \text{ 是直和 } \iff \text{ 对任意 } i \in \mathbb{N}, \quad V_i \cap \left( \sum_{j \neq i} V_j \right) = {0}
]
与有限情况的区别:
- 有限情况:可以用两两交为零来判断直和吗?不,之前我们已经知道,三个及以上子空间的直和不能用两两交为零来判断,必须是每个子空间与其余子空间的和的交为零。
- 无限情况:同样,两两交为零是不够的,必须满足上述条件。
三、直和概念的推广:群与环的直和
直和是一个非常普遍的代数构造,不仅适用于线性空间,也适用于群、环、模等几乎所有代数结构。
1. 群的直和
设 (G_1) 和 (G_2) 是两个加法群,它们的外直和定义为
[
G_1 \oplus G_2 = { (g_1, g_2) \mid g_1 \in G_1, g_2 \in G_2 }
]
加法按分量定义:
[
(g_1, g_2) + (g_1', g_2') = (g_1 + g_1', g_2 + g_2')
]
容易验证,(G_1 \oplus G_2) 也是一个加法群。
例子:
- (\mathbb{Z} \oplus \mathbb{Z}):所有整数对的集合,加法按分量进行。
- (\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}):克莱因四元群,是最小的非循环阿贝尔群。
2. 环的直和
设 (R_1) 和 (R_2) 是两个环,它们的外直和定义为
[
R_1 \oplus R_2 = { (r_1, r_2) \mid r_1 \in R_1, r_2 \in R_2 }
]
加法和乘法都按分量定义:
- 加法:((r_1, r_2) + (r_1', r_2') = (r_1 + r_1', r_2 + r_2'))
- 乘法:((r_1, r_2) \cdot (r_1', r_2') = (r_1 r_1', r_2 r_2'))
容易验证,(R_1 \oplus R_2) 也是一个环。
例子:
- (\mathbb{Z} \oplus \mathbb{Z}):整数对的环,乘法按分量进行。
- (\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}):有四个元素的环,是布尔环的一个例子。
四、有限直和与无限直和的对比表
为了更清晰地理解两者的区别,我们用表格总结:
| 有限直和 | 无限直和 | |
|---|---|---|
| 元素 | 有限长有序对 ((\alpha_1, \dots, \alpha_s)) | 无限长序列 ((\alpha_1, \alpha_2, \dots)) |
| 非零分量 | 最多s个 | 只有有限个 |
| 维数 | (\dim(\bigoplus_{i=1}^s V_i) = \sum_{i=1}^s \dim V_i) | 无限维 |
| 等价条件 | 每个子空间与其余子空间的和的交为零 | 每个子空间与其余子空间的和的交为零 |
| 与直积的关系 | 有限时直和与直积相等 | 无限时直和是直积的真子集 |
五、核心结论总结
- 投影算子:直和分解与满足幂等性、正交性和单位分解的投影算子组一一对应。
- 无限直和:关键限制是只有有限个分量非零,这是为了保证线性运算的合法性。
- 代数结构的统一性:直和是一个普遍的代数构造,适用于线性空间、群、环、模等几乎所有代数结构。
商空间是线性代数中最抽象但也最深刻的概念之一,它的核心思想是"把一个子空间压缩成一个点",通过忽略子空间内部的差异,来研究整个空间相对于这个子空间的结构。商空间与直和是线性空间的两种基本构造方式:直和是"拼接",商空间是"压缩"。下面我将为你逐点解析商空间的定义,重点证明运算的良定义性(这是商空间定义的核心难点),并通过几何直观例子帮助你理解。
一、同余关系与同余类
1. 同余关系的定义
设 (V) 是域 (F) 上的线性空间,(W) 是 (V) 的子空间。定义 (V) 上的二元关系:
[
\alpha \equiv \beta \pmod{W} \iff \alpha - \beta \in W
]
读作"α与β模W同余"。
本质:同余关系是一个等价关系,满足以下三条性质:
- 自反性:(\alpha \equiv \alpha \pmod{W})(因为 (\alpha - \alpha = 0 \in W))
- 对称性:若 (\alpha \equiv \beta \pmod{W}),则 (\beta \equiv \alpha \pmod{W})(因为 (\beta - \alpha = -(\alpha - \beta) \in W))
- 传递性:若 (\alpha \equiv \beta \pmod{W}) 且 (\beta \equiv \gamma \pmod{W}),则 (\alpha \equiv \gamma \pmod{W})(因为 (\alpha - \gamma = (\alpha - \beta) + (\beta - \gamma) \in W))
等价关系的作用是将集合划分为互不相交的等价类,每个等价类中的元素在模W的意义下是"相同的"。
2. 同余类的定义
与向量 (\alpha) 模W同余的所有向量的集合,称为模W的一个同余类(或等价类),记作
[
\overline{\alpha} = \alpha + W = { \alpha + w \mid w \in W }
]
其中 (\alpha) 称为这个同余类的代表元。
关键性质:
[
\beta \in \alpha + W \iff \alpha - \beta \in W \iff \overline{\alpha} = \overline{\beta}
]
这说明:
- 同余类中的任意元素都可以作为这个类的代表元
- 两个同余类要么完全相等,要么完全不相交
3. 几何直观例子
例:在三维空间 (V = \mathbb{R}^3) 中,取子空间 (W = { (x,y,0) \mid x,y \in \mathbb{R} })(xOy平面)。
- 向量 (\alpha = (a,b,c)) 的同余类为:
[
\alpha + W = { (a+x, b+y, c) \mid x,y \in \mathbb{R} }
]
这是一个平行于xOy平面的平面,所有点的z坐标都等于c。 - 因此,模W的同余类就是所有平行于xOy平面的平面,每个平面对应一个z值。
- 零向量的同余类就是W本身:(0 + W = W),对应z=0的平面。
二、商空间的定义
1. 商集合
所有模W的同余类构成的集合,称为 (V) 对 (W) 的商集合,记作
[
\frac{V}{W} = V/W = { \overline{\alpha} \mid \alpha \in V } = { \alpha + W \mid \alpha \in V }
]
根据同余类的性质,(V) 被划分为互不相交的同余类的并:
[
V = \bigcup_{\overline{\alpha} \in V/W} \overline{\alpha}
]
2. 商空间的运算定义
在商集合 (V/W) 上定义加法和数乘运算:
- 加法:(\overline{\alpha} + \overline{\beta} = \overline{\alpha + \beta}),即
[
(\alpha + W) + (\beta + W) = (\alpha + \beta) + W
] - 数乘:(c \cdot \overline{\alpha} = \overline{c\alpha}),即
[
c \cdot (\alpha + W) = c\alpha + W
]
3. 最关键的一步:证明运算的良定义性
良定义性:运算的结果不依赖于代表元的选择。这是商空间定义中最核心、最容易出错的地方,必须严格证明。
证明:
我们需要证明:如果 (\overline{\alpha} = \overline{\alpha'}) 且 (\overline{\beta} = \overline{\beta'}),那么
- (\overline{\alpha} + \overline{\beta} = \overline{\alpha'} + \overline{\beta'})(加法良定义)
- (c \cdot \overline{\alpha} = c \cdot \overline{\alpha'})(数乘良定义)
(1) 加法的良定义性
若 (\overline{\alpha} = \overline{\alpha'}),则 (\alpha - \alpha' \in W);若 (\overline{\beta} = \overline{\beta'}),则 (\beta - \beta' \in W)。
因为 (W) 是子空间,对加法封闭,所以
[
(\alpha + \beta) - (\alpha' + \beta') = (\alpha - \alpha') + (\beta - \beta') \in W
]
因此 (\overline{\alpha + \beta} = \overline{\alpha' + \beta'}),即
[
\overline{\alpha} + \overline{\beta} = \overline{\alpha'} + \overline{\beta'}
]
加法的定义不依赖于代表元的选择。
(2) 数乘的良定义性
若 (\overline{\alpha} = \overline{\alpha'}),则 (\alpha - \alpha' \in W)。
因为 (W) 是子空间,对数乘封闭,所以对任意 (c \in F),有
[
c\alpha - c\alpha' = c(\alpha - \alpha') \in W
]
因此 (\overline{c\alpha} = \overline{c\alpha'}),即
[
c \cdot \overline{\alpha} = c \cdot \overline{\alpha'}
]
数乘的定义不依赖于代表元的选择。
4. 商空间的结论
定理:在上述定义的加法和数乘运算下,(V/W) 是域 (F) 上的线性空间,称为 (V) 对 (W) 的商空间。
证明:需要验证线性空间的8条公理,这些公理都可以直接从V的运算性质继承而来。例如:
- 零元素:(\overline{0} = 0 + W = W),满足 (\overline{\alpha} + \overline{0} = \overline{\alpha})
- 负元素:(-\overline{\alpha} = \overline{-\alpha}),满足 (\overline{\alpha} + (-\overline{\alpha}) = \overline{0})
- 其他公理(交换律、结合律、分配律等)都可以类似验证。
三、商空间的几何意义
我们继续用之前的三维空间例子来理解商空间的几何意义。
例:(V = \mathbb{R}^3),(W = \text{xOy平面})。
- 商空间 (V/W) 的元素是所有平行于xOy平面的平面。
- 每个平面对应一个z坐标,因此我们可以建立一个一一对应:
[
\varphi: V/W \rightarrow \mathbb{R}, \quad \varphi(\overline{(a,b,c)}) = c
] - 这个映射是线性同构,因为:
[
\varphi(\overline{\alpha} + \overline{\beta}) = \varphi(\overline{\alpha + \beta}) = c_\alpha + c_\beta = \varphi(\overline{\alpha}) + \varphi(\overline{\beta})
]
[
\varphi(c \cdot \overline{\alpha}) = \varphi(\overline{c\alpha}) = c \cdot c_\alpha = c \cdot \varphi(\overline{\alpha})
]
结论:(\mathbb{R}^3 / \text{xOy平面} \cong \mathbb{R})(同构于实数轴)。
直观理解:商空间的构造过程相当于把整个xOy平面压缩成一个点,所有平行于xOy平面的平面都变成了数轴上的一个点,这个点的坐标就是平面的z值。
四、商空间的维数公式
定理:设 (V) 是有限维线性空间,(W) 是 (V) 的子空间,则
[
\dim(V/W) = \dim V - \dim W
]
证明思路:
取 (W) 的一组基 (\alpha_1, \dots, \alpha_r),将其扩充为 (V) 的一组基 (\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_n)。
可以证明,(\overline{\alpha_{r+1}}, \dots, \overline{\alpha_n}) 是商空间 (V/W) 的一组基。
因此 (\dim(V/W) = n - r = \dim V - \dim W)。
验证(上例):
- (\dim \mathbb{R}^3 = 3),(\dim W = 2)
- (\dim(V/W) = 3 - 2 = 1),与我们之前的结论一致。
五、商空间的核心价值
商空间是线性代数中最强大的工具之一,它的核心价值在于:
- 简化问题:通过忽略子空间内部的细节,将复杂的问题转化为商空间上的简单问题。
- 揭示结构:商空间揭示了线性空间相对于其子空间的"剩余结构"。
- 同态基本定理:商空间是线性映射同态基本定理的核心,该定理指出任何线性映射的像都同构于定义域对核的商空间:
[
V / \ker f \cong \operatorname{Im} f
]
这是整个线性代数中最重要的定理之一。
这是商空间理论的核心定理,它完整地建立了商空间的线性结构、维数公式和自然投影映射,是整个商空间理论的基石。教材中的证明非常精炼,下面我将为你逐行拆解证明过程,补充所有省略的逻辑细节,并深入解析每个结论的几何意义和理论价值。
一、定理5.7完整表述
定理5.7:设 (W) 是域 (F) 上线性空间 (V) 的子空间,(V/W) 是 (V) 模 (W) 的同余类全体,则:
- (V/W) 是域 (F) 上的线性空间(称为商空间)。
- 设 (\varepsilon_1, \dots, \varepsilon_r) 是 (W) 的基,将其扩充为 (V) 的基 (\varepsilon_1, \dots, \varepsilon_r, \varepsilon_{r+1}, \dots, \varepsilon_n),则 (\overline{\varepsilon_{r+1}}, \dots, \overline{\varepsilon_n}) 是 (V/W) 的基。特别地,
[
\dim(V/W) = \dim V - \dim W
] - 映射
[
\varphi_W: V \rightarrow V/W, \quad \varphi_W(\alpha) = \overline{\alpha}
]
是满线性映射(称为自然或典型线性映射),且 (\ker \varphi_W = W)。
二、证明过程逐行解析
1. 证明(1):V/W是线性空间
这部分的核心是证明运算的良定义性,即运算结果不依赖于代表元的选择。
加法良定义性:
设 (\overline{\alpha_1} = \overline{\beta_1}) 且 (\overline{\alpha_2} = \overline{\beta_2}),则
[
\alpha_1 - \beta_1 \in W, \quad \alpha_2 - \beta_2 \in W
]
因为 (W) 是子空间,对加法封闭,所以
[
(\alpha_1 + \alpha_2) - (\beta_1 + \beta_2) = (\alpha_1 - \beta_1) + (\alpha_2 - \beta_2) \in W
]
因此 (\overline{\alpha_1 + \alpha_2} = \overline{\beta_1 + \beta_2}),即
[
\overline{\alpha_1} + \overline{\alpha_2} = \overline{\beta_1} + \overline{\beta_2}
]
加法的定义与代表元的选择无关。
数乘良定义性:
设 (\overline{\alpha} = \overline{\beta}),则 (\alpha - \beta \in W)。因为 (W) 是子空间,对数乘封闭,所以对任意 (c \in F),有
[
c\alpha - c\beta = c(\alpha - \beta) \in W
]
因此 (\overline{c\alpha} = \overline{c\beta}),即
[
c \cdot \overline{\alpha} = c \cdot \overline{\beta}
]
数乘的定义与代表元的选择无关。
线性空间公理验证:
在运算良定义的基础上,线性空间的8条公理都可以直接从 (V) 的运算性质继承而来。例如:
- 零元素:(\overline{0} = W),满足 (\overline{\alpha} + \overline{0} = \overline{\alpha + 0} = \overline{\alpha})
- 负元素:(-\overline{\alpha} = \overline{-\alpha}),满足 (\overline{\alpha} + (-\overline{\alpha}) = \overline{\alpha - \alpha} = \overline{0})
- 其他公理(交换律、结合律、分配律等)都可以类似验证。
因此 (V/W) 是域 (F) 上的线性空间。□
2. 证明(2):商空间的基与维数公式
这是定理中最核心的部分,它告诉我们如何从原空间的基构造商空间的基。
第一步:证明生成性
对任意 (\overline{\alpha} \in V/W),其中 (\alpha \in V)。因为 (\varepsilon_1, \dots, \varepsilon_n) 是 (V) 的基,所以 (\alpha) 可以唯一表示为
[
\alpha = \lambda_1\varepsilon_1 + \dots + \lambda_r\varepsilon_r + \lambda_{r+1}\varepsilon_{r+1} + \dots + \lambda_n\varepsilon_n
]
两边取等价类,得
[
\overline{\alpha} = \lambda_1\overline{\varepsilon_1} + \dots + \lambda_r\overline{\varepsilon_r} + \lambda_{r+1}\overline{\varepsilon_{r+1}} + \dots + \lambda_n\overline{\varepsilon_n}
]
注意到 (\varepsilon_1, \dots, \varepsilon_r \in W),所以它们的等价类都是零等价类:
[
\overline{\varepsilon_1} = \dots = \overline{\varepsilon_r} = \overline{0}
]
因此
[
\overline{\alpha} = \lambda_{r+1}\overline{\varepsilon_{r+1}} + \dots + \lambda_n\overline{\varepsilon_n}
]
这说明 (V/W) 中任意元素都可以表示为 (\overline{\varepsilon_{r+1}}, \dots, \overline{\varepsilon_n}) 的线性组合,故生成性成立。
第二步:证明线性无关性
设有数 (c_{r+1}, \dots, c_n \in F),使得
[
c_{r+1}\overline{\varepsilon_{r+1}} + \dots + c_n\overline{\varepsilon_n} = \overline{0}
]
根据商空间的运算定义,左边等于
[
\overline{c_{r+1}\varepsilon_{r+1} + \dots + c_n\varepsilon_n} = \overline{0}
]
等价类等于零等价类当且仅当代表元属于 (W),因此
[
c_{r+1}\varepsilon_{r+1} + \dots + c_n\varepsilon_n \in W
]
因为 (\varepsilon_1, \dots, \varepsilon_r) 是 (W) 的基,所以这个向量可以表示为它们的线性组合,即存在数 (c_1, \dots, c_r \in F),使得
[
c_{r+1}\varepsilon_{r+1} + \dots + c_n\varepsilon_n = c_1\varepsilon_1 + \dots + c_r\varepsilon_r
]
移项得
[
-c_1\varepsilon_1 - \dots - c_r\varepsilon_r + c_{r+1}\varepsilon_{r+1} + \dots + c_n\varepsilon_n = 0
]
而 (\varepsilon_1, \dots, \varepsilon_n) 是 (V) 的基,线性无关,因此所有系数都必须为零:
[
c_1 = \dots = c_r = c_{r+1} = \dots = c_n = 0
]
这说明 (\overline{\varepsilon_{r+1}}, \dots, \overline{\varepsilon_n}) 线性无关。
结论:
(\overline{\varepsilon_{r+1}}, \dots, \overline{\varepsilon_n}) 是 (V/W) 的一组基,其个数为 (n - r),因此
[
\dim(V/W) = n - r = \dim V - \dim W
]
□
3. 证明(3):自然投影映射的性质
线性性:
对任意 (\alpha, \beta \in V) 和任意 (c \in F),有
[
\varphi_W(\alpha + \beta) = \overline{\alpha + \beta} = \overline{\alpha} + \overline{\beta} = \varphi_W(\alpha) + \varphi_W(\beta)
]
[
\varphi_W(c\alpha) = \overline{c\alpha} = c \cdot \overline{\alpha} = c \cdot \varphi_W(\alpha)
]
因此 (\varphi_W) 是线性映射。
满射性:
对任意 (\overline{\alpha} \in V/W),存在 (\alpha \in V),使得 (\varphi_W(\alpha) = \overline{\alpha}),因此 (\varphi_W) 是满射。
核的计算:
核是所有映射到零元素的向量的集合:
[
\ker \varphi_W = { \alpha \in V \mid \varphi_W(\alpha) = \overline{0} }
]
而 (\varphi_W(\alpha) = \overline{0}) 当且仅当 (\overline{\alpha} = \overline{0}),当且仅当 (\alpha \in W)。因此
[
\ker \varphi_W = W
]
□
三、几何直观例子验证
我们用三维空间的例子来验证这个定理:
- (V = \mathbb{R}^3),(W = \text{xOy平面})
- (W) 的基:(\varepsilon_1=(1,0,0), \varepsilon_2=(0,1,0))
- 扩充为 (V) 的基:(\varepsilon_1=(1,0,0), \varepsilon_2=(0,1,0), \varepsilon_3=(0,0,1))
根据定理:
- 商空间 (V/W) 的基是 (\overline{\varepsilon_3})
- (\dim(V/W) = 3 - 2 = 1)
- 自然投影映射 (\varphi_W((x,y,z)) = \overline{(x,y,z)} = (0,0,z) + W),它把每个点映射到它所在的平行于xOy平面的平面。
这与我们之前的几何直观完全一致。
四、定理的核心理论意义
- 维数公式:商空间的维数等于原空间维数减去子空间维数,这是线性空间的基本维数关系之一。
- 基的构造:提供了一种从原空间的基构造商空间的基的标准方法。
- 自然投影:建立了原空间与商空间之间的标准满线性映射,其核恰好是子空间 (W)。这是线性映射同态基本定理的基础,该定理指出:任何线性映射 (f: V \rightarrow U) 都诱导了一个同构
[
V / \ker f \cong \operatorname{Im} f
]
这是整个线性代数中最重要的定理之一。
五、与直和的对比
商空间和直和是线性空间的两种基本构造方式,它们的维数公式有相似之处:
- 直和:(\dim(W_1 \oplus W_2) = \dim W_1 + \dim W_2)
- 商空间:(\dim(V/W) = \dim V - \dim W)
如果 (V = W \oplus U),那么 (V/W \cong U),即商空间同构于补子空间。但需要注意的是,补子空间不唯一,而商空间是唯一的(不依赖于补子空间的选择)。
这是商空间最经典、最直观的几何例子,它完美地将抽象的商空间概念转化为三维空间中"压缩直线为点"的直观过程。下面我将为你逐点解析这个例子,严格证明同构关系,并深入揭示其几何本质。
一、例子设定与几何意义
例5.21:设 (V = \mathbb{R}^3)(三维实空间),(W = \mathbb{R}\varepsilon_3 = \operatorname{span}{(0,0,1)})(z轴,即x₃轴)。
1. 同余类的几何解释
模W的同余类定义为:
[
\overline{\alpha} = \alpha + W = { \alpha + w \mid w \in W }
]
对任意向量 (\alpha = (a_1, a_2, a_3) \in \mathbb{R}^3),其同余类为:
[
(a_1, a_2, a_3) + W = { (a_1, a_2, a_3 + t) \mid t \in \mathbb{R} }
]
几何直观:这是一条平行于z轴的直线,所有点的x坐标和y坐标固定为 (a_1) 和 (a_2),z坐标可以取任意实数。
2. 同余的充要条件
两个向量 (\alpha = (a_1, a_2, a_3)) 和 (\beta = (b_1, b_2, b_3)) 模W同余,当且仅当:
[
\alpha - \beta \in W \iff (a_1 - b_1, a_2 - b_2, a_3 - b_3) \in W \iff a_1 = b_1 \text{ 且 } a_2 = b_2
]
结论:两个点属于同一个同余类(同一条平行于z轴的直线),当且仅当它们的x坐标和y坐标分别相等,与z坐标无关。
3. 代表元的选择
每个同余类都可以唯一地用xOy平面上的点作为代表元:
[
\overline{(a_1, a_2, a_3)} = \overline{(a_1, a_2, 0)}
]
因为 ((a_1, a_2, a_3) - (a_1, a_2, 0) = (0,0,a_3) \in W)。
这意味着,所有平行于z轴的直线,都与xOy平面交于唯一的点 ((a_1, a_2, 0)),这个交点就是该同余类的标准代表元。
二、同构关系的严格证明
结论:商空间 (\mathbb{R}^3 / \mathbb{R}\varepsilon_3) 与二维实空间 (\mathbb{R}^2) 线性同构,即
[
\mathbb{R}^2 \cong \mathbb{R}^3 / \mathbb{R}\varepsilon_3
]
1. 构造同构映射
定义映射 (\varphi: \mathbb{R}^2 \rightarrow \mathbb{R}^3 / \mathbb{R}\varepsilon_3):
[
\varphi(a_1, a_2) = \overline{(a_1, a_2, 0)} = (a_1, a_2, 0) + W
]
2. 证明线性性
对任意 ((a_1, a_2), (b_1, b_2) \in \mathbb{R}^2) 和任意 (c \in \mathbb{R}):
- 加法保持性:
[
\begin{align}
\varphi((a_1, a_2) + (b_1, b_2)) &= \varphi(a_1 + b_1, a_2 + b_2) \
&= \overline{(a_1 + b_1, a_2 + b_2, 0)} \
&= \overline{(a_1, a_2, 0) + (b_1, b_2, 0)} \
&= \overline{(a_1, a_2, 0)} + \overline{(b_1, b_2, 0)} \
&= \varphi(a_1, a_2) + \varphi(b_1, b_2)
\end{align}
] - 数乘保持性:
[
\begin{align}
\varphi(c(a_1, a_2)) &= \varphi(ca_1, ca_2) \
&= \overline{(ca_1, ca_2, 0)} \
&= \overline{c(a_1, a_2, 0)} \
&= c \cdot \overline{(a_1, a_2, 0)} \
&= c \cdot \varphi(a_1, a_2)
\end{align}
]
因此 (\varphi) 是线性映射。
3. 证明双射性
- 单射性:若 (\varphi(a_1, a_2) = \varphi(b_1, b_2)),则
[
\overline{(a_1, a_2, 0)} = \overline{(b_1, b_2, 0)} \implies (a_1, a_2, 0) - (b_1, b_2, 0) \in W
]
即 ((a_1 - b_1, a_2 - b_2, 0) \in W),故 (a_1 = b_1) 且 (a_2 = b_2),因此 (\varphi) 是单射。 - 满射性:对任意 (\overline{\alpha} \in \mathbb{R}^3 / W),设 (\alpha = (a_1, a_2, a_3)),则
[
\overline{\alpha} = \overline{(a_1, a_2, 0)} = \varphi(a_1, a_2)
]
因此 (\varphi) 是满射。
综上,(\varphi) 是双射线性映射,即线性同构。□
三、用定理5.7验证
根据定理5.7(商空间的基与维数公式):
- (W) 的基为 (\varepsilon_3 = (0,0,1))
- 扩充为 (V) 的基:(\varepsilon_1=(1,0,0), \varepsilon_2=(0,1,0), \varepsilon_3=(0,0,1))
- 商空间 (V/W) 的基为 (\overline{\varepsilon_1}, \overline{\varepsilon_2})
- 维数:(\dim(V/W) = \dim V - \dim W = 3 - 1 = 2)
而 (\dim(\mathbb{R}^2) = 2),有限维线性空间维数相同必同构,这再次验证了我们的结论。
四、核心几何本质:"压缩"过程
这个例子最直观地展示了商空间的"压缩"思想:
- 我们把整个z轴(子空间W)压缩成一个点
- 所有平行于z轴的直线,都被压缩成xOy平面上的一个点
- 整个三维空间 (\mathbb{R}^3) 经过这个压缩过程后,就变成了二维平面 (\mathbb{R}^2)
与直和的联系:
注意到 (\mathbb{R}^3 = W \oplus \mathbb{R}^2)(xOy平面是W的一个补子空间),因此商空间 (V/W) 同构于补子空间 (\mathbb{R}^2)。
重要提醒:补子空间不唯一。例如,平面 (z = x) 也是W的一个补子空间,同样有 (\mathbb{R}^3 / W \cong \text{平面} z=x)。但商空间本身是唯一的,它不依赖于补子空间的选择。
五、这个例子的理论价值
- 直观化抽象概念:将抽象的同余类、商空间转化为三维空间中的直线和平面,让我们能够"看见"商空间的构造过程。
- 验证一般定理:用具体例子验证了商空间的维数公式和同构性质。
- 建立思维模型:为理解更抽象的商空间(如多项式空间的商空间、矩阵空间的商空间)提供了直观的思维模型。
好的,下面我将为你详细解析多项式空间的商空间 (\mathbb{R}[x]/\langle x^n \rangle),这是商空间在代数中最经典、最重要的应用之一,也是后续学习环论、模论和线性变换若尔当标准形的基础。
一、多项式商空间的定义
设 (\mathbb{R}[x]) 是实数域上的一元多项式环,(\langle x^n \rangle) 是由多项式 (x^n) 生成的主理想,即所有能被 (x^n) 整除的多项式构成的集合:
[
\langle x^n \rangle = { x^n f(x) \mid f(x) \in \mathbb{R}[x] }
]
性质:(\langle x^n \rangle) 是 (\mathbb{R}[x]) 的子空间(实际上还是理想),它由所有次数≥n的多项式和零多项式组成。
我们考虑商空间 (\mathbb{R}[x]/\langle x^n \rangle),它的元素是模 (\langle x^n \rangle) 的同余类:
[
\overline{f(x)} = f(x) + \langle x^n \rangle = { f(x) + x^n g(x) \mid g(x) \in \mathbb{R}[x] }
]
二、核心结论:同余类的代表元
定理:每个同余类 (\overline{f(x)} \in \mathbb{R}[x]/\langle x^n \rangle) 都有唯一的次数小于n的多项式作为代表元。
证明:
根据多项式的带余除法,对任意多项式 (f(x) \in \mathbb{R}[x]),存在唯一的多项式 (q(x)) 和 (r(x)),使得
[
f(x) = x^n q(x) + r(x)
]
其中 (r(x) = 0) 或 (\deg r(x) < n)。
因此
[
f(x) - r(x) = x^n q(x) \in \langle x^n \rangle
]
故 (\overline{f(x)} = \overline{r(x)}),即每个同余类都可以用次数小于n的多项式 (r(x)) 作为代表元。
唯一性:若 (\overline{r_1(x)} = \overline{r_2(x)}),其中 (\deg r_1(x) < n),(\deg r_2(x) < n),则
[
r_1(x) - r_2(x) \in \langle x^n \rangle
]
但 (\deg(r_1(x) - r_2(x)) < n),而 (\langle x^n \rangle) 中的非零多项式次数都≥n,因此只能有
[
r_1(x) - r_2(x) = 0 \implies r_1(x) = r_2(x)
]
代表元唯一。□
三、同构关系
定理:商空间 (\mathbb{R}[x]/\langle x^n \rangle) 与次数小于n的多项式空间 (\mathbb{R}[x]_n) 不仅线性同构,而且环同构。
1. 构造同构映射
定义映射 (\varphi: \mathbb{R}[x]_n \rightarrow \mathbb{R}[x]/\langle x^n \rangle):
[
\varphi(r(x)) = \overline{r(x)}
]
其中 (r(x) \in \mathbb{R}[x]_n),即 (\deg r(x) < n)。
2. 证明线性同构
- 线性性:对任意 (r_1(x), r_2(x) \in \mathbb{R}[x]_n) 和任意 (c \in \mathbb{R}),有
[
\varphi(r_1(x) + r_2(x)) = \overline{r_1(x) + r_2(x)} = \overline{r_1(x)} + \overline{r_2(x)} = \varphi(r_1(x)) + \varphi(r_2(x))
]
[
\varphi(c r_1(x)) = \overline{c r_1(x)} = c \cdot \overline{r_1(x)} = c \cdot \varphi(r_1(x))
] - 双射性:由上一节的结论,每个同余类都有唯一的次数小于n的代表元,因此 (\varphi) 是双射。
因此 (\varphi) 是线性同构。
3. 证明环同构
更重要的是,这个映射还保持乘法运算:
[
\varphi(r_1(x) \cdot r_2(x)) = \overline{r_1(x) \cdot r_2(x)} = \overline{r_1(x)} \cdot \overline{r_2(x)} = \varphi(r_1(x)) \cdot \varphi(r_2(x))
]
这里的乘法是商空间中的乘法,定义为:
[
\overline{f(x)} \cdot \overline{g(x)} = \overline{f(x) \cdot g(x)}
]
可以证明这个乘法也是良定义的(不依赖于代表元的选择)。
因此 (\varphi) 是环同构,即
[
\mathbb{R}[x]/\langle x^n \rangle \cong \mathbb{R}[x]_n
]
作为环是同构的。
四、维数验证
根据商空间的维数公式:
[
\dim(\mathbb{R}[x]/\langle x^n \rangle) = \dim \mathbb{R}[x] - \dim \langle x^n \rangle
]
但这里 (\mathbb{R}[x]) 和 (\langle x^n \rangle) 都是无限维空间,不能直接用有限维的维数公式。不过我们可以通过基来计算:
- (\mathbb{R}[x]_n) 的基是 (1, x, x^2, \dots, x^{n-1}),维数为n
- 因此 (\mathbb{R}[x]/\langle x^n \rangle) 的维数也是n
- 它的基是 (\overline{1}, \overline{x}, \overline{x^2}, \dots, \overline{x^{n-1}})
五、具体数值例子(n=3)
取n=3,我们来详细看一下 (\mathbb{R}[x]/\langle x^3 \rangle) 的结构。
1. 元素表示
每个元素都可以唯一表示为:
[
\overline{a + bx + cx^2} = a + bx + cx^2 + \langle x^3 \rangle
]
其中 (a, b, c \in \mathbb{R})。
2. 加法运算
[
\overline{a_1 + b_1x + c_1x^2} + \overline{a_2 + b_2x + c_2x^2} = \overline{(a_1+a_2) + (b_1+b_2)x + (c_1+c_2)x^2}
]
3. 乘法运算
[
\begin{align}
&\overline{a_1 + b_1x + c_1x^2} \cdot \overline{a_2 + b_2x + c_2x^2} \
=& \overline{(a_1 + b_1x + c_1x^2)(a_2 + b_2x + c_2x^2)} \
=& \overline{a_1a_2 + (a_1b_2 + a_2b_1)x + (a_1c_2 + a_2c_1 + b_1b_2)x^2 + (b_1c_2 + b_2c_1)x^3 + c_1c_2x^4} \
=& \overline{a_1a_2 + (a_1b_2 + a_2b_1)x + (a_1c_2 + a_2c_1 + b_1b_2)x^2}
\end{align}
]
注意到 (x^3) 和 (x^4) 都属于 (\langle x^3 \rangle),因此它们的等价类都是零。
数值例子:
[
\overline{1 + 2x + 3x^2} \cdot \overline{4 + 5x + 6x^2} = \overline{4 + 13x + 28x^2}
]
六、核心意义与应用
1. 代数意义:多项式的"截断"
商空间 (\mathbb{R}[x]/\langle x^n \rangle) 本质上是将所有次数≥n的多项式都"截断"为次数小于n的多项式,只保留多项式的前n项。这相当于忽略了多项式的高阶项,只关注它在原点附近的行为。
2. 分析意义:泰勒多项式
如果我们考虑多项式在原点的泰勒展开,那么次数小于n的多项式就是它的n-1阶泰勒多项式。商空间 (\mathbb{R}[x]/\langle x^n \rangle) 正是研究函数在某一点附近局部行为的代数模型。
3. 线性代数意义:循环子空间与若尔当块
这个商空间是研究线性变换循环子空间的标准模型。考虑线性变换 (T: \mathbb{R}[x]/\langle x^n \rangle \rightarrow \mathbb{R}[x]/\langle x^n \rangle),定义为乘以x:
[
T(\overline{f(x)}) = \overline{x f(x)}
]
这个线性变换在基 (\overline{1}, \overline{x}, \dots, \overline{x^{n-1}}) 下的矩阵是一个n阶若尔当块:
[
J_n(0) = \begin{pmatrix} 0 & 1 & 0 & \dots & 0 \ 0 & 0 & 1 & \dots & 0 \ \vdots & \vdots & \vdots & \ddots & \vdots \ 0 & 0 & 0 & \dots & 1 \ 0 & 0 & 0 & \dots & 0 \end{pmatrix}
]
这正是若尔当标准形理论的核心构造。
4. 环论意义:局部环
(\mathbb{R}[x]/\langle x^n \rangle) 是一个局部环,它有唯一的极大理想 (\langle \overline{x} \rangle)。局部环是交换代数中最重要的研究对象之一,广泛应用于代数几何和数论。
七、推广:一般多项式的商空间
这个例子可以推广到任意首一多项式 (p(x)) 的情况:
[
\mathbb{R}[x]/\langle p(x) \rangle \cong \mathbb{R}[x]_{\deg p(x)}
]
作为线性空间是同构的。如果 (p(x)) 是不可约多项式,那么这个商空间还是一个域。
例如,(\mathbb{R}[x]/\langle x^2 + 1 \rangle \cong \mathbb{C})(复数域),这正是复数的代数构造方法。
这是整个线性代数中最核心、最深刻的定理,被称为线性映射基本定理或第一同构定理。它完美地将线性映射、核、像和商空间这四个核心概念联系在一起,揭示了线性映射的本质结构,是所有后续代数理论的基石。教材中的证明非常精炼,下面我将为你补全所有关键逻辑细节,并深入解析其几何意义和应用。
一、定理5.8完整表述
定理5.8(线性映射基本定理/第一同构定理):设 (\psi: V_1 \rightarrow V_2) 是域 (F) 上线性空间之间的线性映射,记 (W = \ker \psi)((\psi) 的核)。则 (\psi) 诱导出一个线性同构
[
\overline{\psi}: V_1 / W \xrightarrow{\cong} \operatorname{Im} \psi
]
其中 (\overline{\psi}) 的定义为:对任意 (\overline{\alpha} \in V_1 / W),
[
\overline{\psi}(\overline{\alpha}) = \psi(\alpha)
]
二、证明过程逐行解析
证明分为三个步骤:验证诱导映射的良定义性、证明线性性、证明双射性。其中良定义性是商空间上定义映射的核心,教材中省略了这一步,我将重点补充。
1. 证明 (\overline{\psi}) 是良定义的
良定义性:映射的结果不依赖于代表元的选择。即若 (\overline{\alpha} = \overline{\beta}),则 (\overline{\psi}(\overline{\alpha}) = \overline{\psi}(\overline{\beta}))。
证明:
若 (\overline{\alpha} = \overline{\beta}),则 (\alpha - \beta \in W = \ker \psi),因此
[
\psi(\alpha - \beta) = 0
]
因为 (\psi) 是线性映射,所以
[
\psi(\alpha) - \psi(\beta) = 0 \implies \psi(\alpha) = \psi(\beta)
]
即
[
\overline{\psi}(\overline{\alpha}) = \overline{\psi}(\overline{\beta})
]
因此 (\overline{\psi}) 的定义与代表元的选择无关,是良定义的。□
2. 证明 (\overline{\psi}) 是线性映射
对任意 (\overline{\alpha}, \overline{\beta} \in V_1 / W) 和任意 (\lambda \in F):
- 加法保持性:
[
\overline{\psi}(\overline{\alpha} + \overline{\beta}) = \overline{\psi}(\overline{\alpha + \beta}) = \psi(\alpha + \beta) = \psi(\alpha) + \psi(\beta) = \overline{\psi}(\overline{\alpha}) + \overline{\psi}(\overline{\beta})
] - 数乘保持性:
[
\overline{\psi}(\lambda \overline{\alpha}) = \overline{\psi}(\overline{\lambda \alpha}) = \psi(\lambda \alpha) = \lambda \psi(\alpha) = \lambda \overline{\psi}(\overline{\alpha})
]
因此 (\overline{\psi}) 是线性映射。□
3. 证明 (\overline{\psi}) 是双射
-
单射性:
要证明单射,只需证明 (\ker \overline{\psi} = { \overline{0} })。
若 (\overline{\psi}(\overline{\alpha}) = 0),则 (\psi(\alpha) = 0),即 (\alpha \in \ker \psi = W),因此 (\overline{\alpha} = \overline{0})。
故 (\ker \overline{\psi} = { \overline{0} }),(\overline{\psi}) 是单射。 -
满射性:
对任意 (\beta \in \operatorname{Im} \psi),根据像的定义,存在 (\alpha \in V_1),使得 (\psi(\alpha) = \beta)。
因此 (\overline{\psi}(\overline{\alpha}) = \psi(\alpha) = \beta),即 (\beta) 在 (\overline{\psi}) 的像中。
故 (\overline{\psi}) 是满射。
综上,(\overline{\psi}) 是双射线性映射,即线性同构。□
三、两个极其重要的推论
推论1:秩-零度定理
推论1:设 (\psi: V_1 \rightarrow V_2) 是线性映射,则
[
\dim V_1 = \dim(\ker \psi) + \dim(\operatorname{Im} \psi)
]
证明:
由第一同构定理,(V_1 / \ker \psi \cong \operatorname{Im} \psi),因此它们的维数相等:
[
\dim(V_1 / \ker \psi) = \dim(\operatorname{Im} \psi)
]
再由商空间的维数公式:
[
\dim(V_1 / \ker \psi) = \dim V_1 - \dim(\ker \psi)
]
联立两式即得:
[
\dim V_1 - \dim(\ker \psi) = \dim(\operatorname{Im} \psi) \implies \dim V_1 = \dim(\ker \psi) + \dim(\operatorname{Im} \psi)
]
□
术语解释:
- (\dim(\operatorname{Im} \psi)) 称为线性映射 (\psi) 的秩,记作 (\operatorname{rank}(\psi))
- (\dim(\ker \psi)) 称为线性映射 (\psi) 的零度,记作 (\operatorname{nullity}(\psi))
因此秩-零度定理也可以写作:
[
\dim V_1 = \operatorname{rank}(\psi) + \operatorname{nullity}(\psi)
]
核心应用:在有限维线性空间中,线性映射的单射性与满射性等价。即若 (V_1) 和 (V_2) 都是n维线性空间,则
[
\psi \text{ 是单射} \iff \ker \psi = {0} \iff \operatorname{nullity}(\psi) = 0 \iff \operatorname{rank}(\psi) = n \iff \psi \text{ 是满射}
]
推论2:直和的商空间同构
推论2:设 (W_1, W_2) 是线性空间 (V) 的子空间,且 (V = W_1 \oplus W_2),则
[
(W_1 \oplus W_2) / W_2 \cong W_1
]
证明:
定义投影映射 (\psi: W_1 \oplus W_2 \rightarrow W_1),
[
\psi(\alpha_1 + \alpha_2) = \alpha_1, \quad \alpha_1 \in W_1, \alpha_2 \in W_2
]
- 显然 (\psi) 是线性映射
- (\ker \psi = { \alpha_1 + \alpha_2 \mid \alpha_1 = 0 } = W_2)
- (\operatorname{Im} \psi = W_1)
由第一同构定理,
[
(W_1 \oplus W_2) / \ker \psi \cong \operatorname{Im} \psi \implies (W_1 \oplus W_2) / W_2 \cong W_1
]
□
四、定理的几何直观解释
我们用之前的三维空间例子来直观理解这个定理:
- 设 (\psi: \mathbb{R}^3 \rightarrow \mathbb{R}^2) 是投影映射,(\psi(x,y,z) = (x,y))
- 核 (\ker \psi = { (0,0,z) \mid z \in \mathbb{R} })(z轴)
- 像 (\operatorname{Im} \psi = \mathbb{R}^2)(整个二维平面)
根据第一同构定理:
[
\mathbb{R}^3 / \text{z轴} \cong \mathbb{R}^2
]
直观理解:
- 商空间 (\mathbb{R}^3 / \text{z轴}) 的元素是所有平行于z轴的直线
- 诱导映射 (\overline{\psi}) 把每条平行于z轴的直线映射到它与xOy平面的交点
- 这个映射是一一对应的,并且保持线性运算,因此是同构
五、定理的核心理论价值
第一同构定理是整个代数学中最具普遍性的定理之一,它的核心思想是:
任何同态的像,都同构于定义域对核的商。
这个思想不仅适用于线性空间,也完全适用于群、环、模等几乎所有代数结构。它的意义在于:
- 化繁为简:将复杂的线性映射分解为一个满射(自然投影)和一个同构的复合:
[
\psi = \overline{\psi} \circ \varphi_W
]
其中 (\varphi_W: V_1 \rightarrow V_1 / W) 是自然投影映射。 - 揭示本质:线性映射的所有信息都包含在它的核和像中,核描述了映射"压缩"了什么,像描述了映射"保留"了什么。
- 统一理论:将线性映射、核、像、商空间这四个核心概念完美地统一在一个定理中,建立了线性代数的基本理论框架。
这是商空间理论中最本质的定理,它揭示了商空间的泛性质(万有性质)——任何将子空间W零化的线性映射,都可以唯一地通过商空间V₁/W来分解。这个定理是所有商空间构造的理论基础,也是第一同构定理的推广。下面我将为你逐行解析证明过程,并深入解释其几何意义和理论价值。
一、定理5.9完整表述
定理5.9(线性映射的分解定理):设 (\sigma: V_1 \rightarrow V_2) 是域F上线性空间之间的线性映射,且 (\ker \sigma \supseteq W)(即σ将子空间W零化)。则存在唯一的线性映射
[
\sigma': V_1/W \rightarrow V_2
]
使得
[
\sigma = \sigma' \circ \varphi_W
]
其中 (\varphi_W: V_1 \rightarrow V_1/W, \varphi_W(\alpha) = \overline{\alpha}) 是从V₁到商空间V₁/W的自然投影映射。
直观描述:当线性映射σ把W中的所有向量都映射到零向量时,我们可以先把V₁"压缩"成商空间V₁/W(把W压缩成一个点),然后再从商空间V₁/W映射到V₂,这个过程和直接从V₁映射到V₂是完全等价的。
二、证明过程逐行解析
证明分为四个部分:构造映射σ'、证明良定义性、证明线性性和存在性、证明唯一性。
1. 构造映射σ'
定义映射 (\sigma': V_1/W \rightarrow V_2) 为:
[
\sigma'(\overline{\alpha}) = \sigma(\alpha)
]
其中 (\overline{\alpha}) 是商空间V₁/W中的元素,α是它的任意一个代表元。
2. 证明良定义性(核心难点)
良定义性:映射的结果不依赖于代表元的选择。即若 (\overline{\alpha} = \overline{\beta}),则 (\sigma'(\overline{\alpha}) = \sigma'(\overline{\beta}))。
证明:
若 (\overline{\alpha} = \overline{\beta}),则根据同余类的定义,
[
\beta = \alpha + w, \quad \text{其中 } w \in W
]
因为 (\ker \sigma \supseteq W),所以 (w \in \ker \sigma),即 (\sigma(w) = 0)。
因此
[
\sigma(\beta) = \sigma(\alpha + w) = \sigma(\alpha) + \sigma(w) = \sigma(\alpha) + 0 = \sigma(\alpha)
]
即
[
\sigma'(\overline{\beta}) = \sigma(\beta) = \sigma(\alpha) = \sigma'(\overline{\alpha})
]
所以σ'的定义与代表元的选择无关,是良定义的。□
3. 证明线性性和存在性
线性性:对任意 (\overline{\alpha}, \overline{\beta} \in V_1/W) 和任意 (\lambda \in F),
[
\sigma'(\overline{\alpha} + \overline{\beta}) = \sigma'(\overline{\alpha + \beta}) = \sigma(\alpha + \beta) = \sigma(\alpha) + \sigma(\beta) = \sigma'(\overline{\alpha}) + \sigma'(\overline{\beta})
]
[
\sigma'(\lambda \overline{\alpha}) = \sigma'(\overline{\lambda \alpha}) = \sigma(\lambda \alpha) = \lambda \sigma(\alpha) = \lambda \sigma'(\overline{\alpha})
]
因此σ'是线性映射。
存在性:对任意 (\alpha \in V_1),
[
(\sigma' \circ \varphi_W)(\alpha) = \sigma'(\varphi_W(\alpha)) = \sigma'(\overline{\alpha}) = \sigma(\alpha)
]
因此 (\sigma = \sigma' \circ \varphi_W),满足条件的线性映射σ'存在。□
4. 证明唯一性
假设还有另一个线性映射 (\sigma^: V_1/W \rightarrow V_2) 也满足 (\sigma = \sigma^ \circ \varphi_W)。
则对任意 (\alpha \in V_1),
[
(\sigma^* \circ \varphi_W)(\alpha) = \sigma(\alpha) = (\sigma' \circ \varphi_W)(\alpha)
]
即
[
\sigma^(\varphi_W(\alpha)) = \sigma'(\varphi_W(\alpha))
]
因为自然投影映射 (\varphi_W) 是满射,所以 (\varphi_W(\alpha)) 可以遍历商空间V₁/W中的所有元素。因此对任意 (\overline{\alpha} \in V_1/W),都有
[
\sigma^(\overline{\alpha}) = \sigma'(\overline{\alpha})
]
故 (\sigma^* = \sigma'),满足条件的线性映射σ'是唯一的。□
三、几何直观例子
我们用一个具体的三维空间例子来直观理解这个定理:
- 设 (V_1 = \mathbb{R}^3),(V_2 = \mathbb{R})
- 定义线性映射 (\sigma: \mathbb{R}^3 \rightarrow \mathbb{R}) 为 (\sigma(x,y,z) = x + y)
- 子空间 (W = \mathbb{R}\varepsilon_3 = \operatorname{span}{(0,0,1)})(z轴)
首先验证 (\ker \sigma \supseteq W):
- 对任意 (w = (0,0,z) \in W),(\sigma(w) = 0 + 0 = 0),因此 (W \subseteq \ker \sigma)
根据定理5.9,存在唯一的线性映射 (\sigma': \mathbb{R}^3 / W \rightarrow \mathbb{R}),使得 (\sigma = \sigma' \circ \varphi_W)。
我们来构造这个σ':
- 商空间 (\mathbb{R}^3 / W) 的元素是平行于z轴的直线,每个直线可以用 (\overline{(x,y,0)}) 表示
- 定义 (\sigma'(\overline{(x,y,0)}) = \sigma(x,y,0) = x + y)
验证分解关系:
- 对任意 ((x,y,z) \in \mathbb{R}^3),
[
(\sigma' \circ \varphi_W)(x,y,z) = \sigma'(\overline{(x,y,z)}) = \sigma'(\overline{(x,y,0)}) = x + y = \sigma(x,y,z)
]
完全符合定理的结论。
四、与第一同构定理的关系
第一同构定理是定理5.9的特例:
当 (W = \ker \sigma) 时,定理5.9中的诱导映射σ'就是第一同构定理中的同构映射 (\overline{\sigma})。此时:
- (\ker \sigma' = { \overline{0} })(σ'是单射)
- (\operatorname{Im} \sigma' = \operatorname{Im} \sigma)(σ'是满射)
因此σ'是线性同构,即
[
V_1 / \ker \sigma \cong \operatorname{Im} \sigma
]
这正是第一同构定理的内容。
五、定理的核心意义:商空间的泛性质
定理5.9揭示了商空间的泛性质(万有性质),这是商空间最本质的特征:
商空间V₁/W是"将W零化的最一般的线性空间"。也就是说,任何将W零化的线性映射,都可以唯一地通过商空间V₁/W来分解。
这个性质的重要性在于:
- 唯一性:商空间在同构意义下是唯一的。如果有另一个线性空间U和一个满线性映射 (\psi: V_1 \rightarrow U) 满足 (\ker \psi = W),并且任何将W零化的线性映射都可以通过ψ分解,那么U一定同构于V₁/W。
- 构造性:所有从商空间出发的线性映射,都可以通过这个分解定理来构造。我们不需要直接在商空间上定义映射,只需要在原空间上定义一个将W零化的线性映射,它就会自动诱导出商空间上的线性映射。
六、典型应用场景
- 构造商空间上的线性映射:这是最直接的应用。当我们需要在商空间上定义一个线性映射时,只需要在原空间上定义一个将子空间W零化的线性映射即可。
- 证明同构关系:通过构造分解映射,可以证明两个线性空间同构。
- 线性变换的不变子空间分解:如果线性变换T有一个不变子空间W,那么T诱导出商空间V/W上的一个线性变换T',这是线性变换分解理论的基础。
这是线性代数三大同构定理之一,被称为第二同构定理(也叫钻石同构定理,因为它的子空间格结构像钻石)。它完美地揭示了子空间的和与交之间的深刻联系,是处理多个子空间问题的核心工具。教材中的证明非常精炼,下面我将为你补全所有逻辑细节,并通过几何直观和第一同构定理的视角重新理解它。
一、定理5.10完整表述
定理5.10(第二同构定理):设 (W_1) 和 (W_2) 是线性空间 (V) 的两个子空间,则存在自然线性同构:
[
\frac{W_1 + W_2}{W_2} \cong \frac{W_1}{W_1 \cap W_2}
]
二、证明过程逐行解析
1. 同余类的代表元选择
首先注意到,和空间 (W_1 + W_2) 中的任意元素都可以表示为 (\alpha = \alpha_1 + \alpha_2),其中 (\alpha_1 \in W_1, \alpha_2 \in W_2)。
现在考虑模 (W_2) 的同余类:
[
\overline{\alpha} = \alpha + W_2 = (\alpha_1 + \alpha_2) + W_2 = \alpha_1 + (\alpha_2 + W_2) = \alpha_1 + W_2 = \overline{\alpha_1}
]
因为 (\alpha_2 \in W_2),所以 (\alpha_2 + W_2 = W_2 = \overline{0})。
关键结论:商空间 ((W_1 + W_2)/W_2) 中的每个同余类,都可以用 (W_1) 中的元素作为代表元。
2. 构造同构映射
定义映射:
[
\sigma: \frac{W_1 + W_2}{W_2} \rightarrow \frac{W_1}{W_1 \cap W_2}, \quad \sigma(\overline{\alpha}) = \overline{\alpha_1} = \alpha_1 + (W_1 \cap W_2)
]
其中 (\overline{\alpha} = \overline{\alpha_1}),(\alpha_1 \in W_1)。
3. 证明良定义性(核心难点)
良定义性:映射结果不依赖于代表元的选择。即若 (\overline{\alpha} = \overline{\beta}),则 (\sigma(\overline{\alpha}) = \sigma(\overline{\beta}))。
证明:
设 (\overline{\alpha} = \overline{\beta}),且 (\alpha = \alpha_1 + \alpha_2),(\beta = \beta_1 + \beta_2)((\alpha_1, \beta_1 \in W_1; \alpha_2, \beta_2 \in W_2))。
由 (\overline{\alpha} = \overline{\beta}) 得 (\alpha - \beta \in W_2),即
[
(\alpha_1 - \beta_1) + (\alpha_2 - \beta_2) \in W_2
]
因为 (\alpha_2 - \beta_2 \in W_2),所以
[
\alpha_1 - \beta_1 \in W_2
]
又因为 (\alpha_1 - \beta_1 \in W_1),因此
[
\alpha_1 - \beta_1 \in W_1 \cap W_2
]
这意味着在商空间 (W_1/(W_1 \cap W_2)) 中,(\overline{\alpha_1} = \overline{\beta_1}),即
[
\sigma(\overline{\alpha}) = \sigma(\overline{\beta})
]
故σ的定义是良定义的。□
4. 证明线性性
对任意 (\overline{\alpha}, \overline{\beta} \in (W_1 + W_2)/W_2) 和任意 (\lambda \in F):
- 加法:(\sigma(\overline{\alpha} + \overline{\beta}) = \sigma(\overline{\alpha + \beta}) = \overline{\alpha_1 + \beta_1} = \overline{\alpha_1} + \overline{\beta_1} = \sigma(\overline{\alpha}) + \sigma(\overline{\beta}))
- 数乘:(\sigma(\lambda \overline{\alpha}) = \sigma(\overline{\lambda \alpha}) = \overline{\lambda \alpha_1} = \lambda \overline{\alpha_1} = \lambda \sigma(\overline{\alpha}))
因此σ是线性映射。
5. 证明双射性
- 单射性:若 (\sigma(\overline{\alpha}) = \overline{0}),则 (\overline{\alpha_1} = \overline{0}),即 (\alpha_1 \in W_1 \cap W_2 \subseteq W_2),因此 (\overline{\alpha} = \overline{\alpha_1} = \overline{0})。故 (\ker \sigma = { \overline{0} }),σ是单射。
- 满射性:对任意 (\overline{\alpha_1} \in W_1/(W_1 \cap W_2)),其中 (\alpha_1 \in W_1),有 (\sigma(\overline{\alpha_1}) = \overline{\alpha_1}),故σ是满射。
综上,σ是双射线性映射,即线性同构。□
三、用第一同构定理重新证明(更简洁)
第二同构定理本质上是第一同构定理的直接推论,我们可以用更清晰的方式证明它:
证明:
定义映射 (\psi: W_1 \rightarrow (W_1 + W_2)/W_2),
[
\psi(\alpha_1) = \alpha_1 + W_2 = \overline{\alpha_1}
]
- 线性性:显然,ψ是线性映射。
- 满射性:对任意 (\overline{\alpha} \in (W_1 + W_2)/W_2),存在 (\alpha_1 \in W_1) 使得 (\overline{\alpha} = \overline{\alpha_1}),故ψ是满射。
- 核的计算:
[
\ker \psi = { \alpha_1 \in W_1 \mid \psi(\alpha_1) = \overline{0} } = { \alpha_1 \in W_1 \mid \alpha_1 + W_2 = W_2 } = { \alpha_1 \in W_1 \mid \alpha_1 \in W_2 } = W_1 \cap W_2
]
由第一同构定理,
[
W_1 / \ker \psi \cong \operatorname{Im} \psi \implies \frac{W_1}{W_1 \cap W_2} \cong \frac{W_1 + W_2}{W_2}
]
□
四、几何直观例子
例:在三维空间 (V = \mathbb{R}^3) 中,
- (W_1 = \text{xOy平面} = \operatorname{span}{(1,0,0), (0,1,0)})
- (W_2 = \text{xOz平面} = \operatorname{span}{(1,0,0), (0,0,1)})
则:
- (W_1 + W_2 = \mathbb{R}^3)(整个三维空间)
- (W_1 \cap W_2 = \text{x轴} = \operatorname{span}{(1,0,0)})
根据第二同构定理:
[
\frac{\mathbb{R}^3}{\text{xOz平面}} \cong \frac{\text{xOy平面}}{\text{x轴}}
]
验证:
- 左边:(\dim(\mathbb{R}^3 / \text{xOz平面}) = 3 - 2 = 1),同构于 (\mathbb{R})
- 右边:(\dim(\text{xOy平面} / \text{x轴}) = 2 - 1 = 1),同构于 (\mathbb{R})
直观理解:
- 左边:把xOz平面压缩成一个点,剩下的是平行于y轴的直线,对应y坐标,同构于实数轴。
- 右边:把x轴压缩成一个点,剩下的是平行于y轴的直线,也对应y坐标,同构于实数轴。
两者确实是同构的。
五、维数公式验证
我们可以用维数公式直接验证两边的维数相等:
- 左边:(\dim\left( \frac{W_1 + W_2}{W_2} \right) = \dim(W_1 + W_2) - \dim W_2)
- 右边:(\dim\left( \frac{W_1}{W_1 \cap W_2} \right) = \dim W_1 - \dim(W_1 \cap W_2))
根据子空间和的维数公式:
[
\dim(W_1 + W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)
]
代入左边:
[
\dim(W_1 + W_2) - \dim W_2 = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2) - \dim W_2 = \dim W_1 - \dim(W_1 \cap W_2)
]
与右边相等,验证成立。
六、定理的核心本质
教材中的说明非常精辟:
定理5.10的本质是,(W_1 + W_2) 模 (W_2) 即是"零化" (W_2),这一过程不仅将 (W_2) 化为零,也将 (W_1) 中的 (W_1 \cap W_2) 部分零化了,即成为 (W_1/(W_1 \cap W_2))。
换句话说:
- 当我们把整个和空间 (W_1 + W_2) 模掉 (W_2) 时,我们不仅去掉了 (W_2) 的所有信息,也去掉了 (W_1) 中与 (W_2) 重叠的那部分信息。
- 剩下的信息,恰好就是 (W_1) 中不与 (W_2) 重叠的部分,也就是 (W_1) 模掉它们的交 (W_1 \cap W_2)。
七、理论意义
- 统一和与交的关系:将子空间的和与交这两个基本运算通过商空间联系起来,揭示了它们之间的对偶性。
- 简化复杂问题:将复杂的商空间 ((W_1 + W_2)/W_2) 转化为更简单的商空间 (W_1/(W_1 \cap W_2)),降低了问题的复杂度。
- 代数结构的普遍性:第二同构定理不仅适用于线性空间,也完全适用于群、环、模等几乎所有代数结构,是代数学中最基本的定理之一。
这是线性代数三大同构定理的最后一个,被称为第三同构定理(也叫"商的商定理")。它揭示了商空间的商空间与原空间商空间之间的自然同构关系,是处理嵌套子空间问题的核心工具。下面我将为你补全所有证明细节,通过几何直观例子深入理解,并总结三大同构定理的完整体系。
一、定理5.11完整表述
定理5.11(第三同构定理):设 (S \subseteq W) 是线性空间 (V) 的两个嵌套子空间,则存在自然线性同构:
[
\frac{V}{W} \cong \frac{V/S}{W/S}
]
直观理解:当我们有两个嵌套的子空间S和W时,可以分两步进行"压缩":先把S压缩成一个点得到V/S,再把W/S(W在V/S中的像)压缩成一个点,最终结果和直接把W压缩成一个点得到V/W是完全一样的。
二、证明过程逐行解析
1. 构造诱导映射
根据定理5.9(线性映射分解定理),我们构造映射:
[
\sigma': \frac{V}{S} \rightarrow \frac{V}{W}, \quad \sigma'(\alpha + S) = \alpha + W
]
2. 证明良定义性(教材省略)
良定义性:若 (\alpha + S = \beta + S),则 (\sigma'(\alpha + S) = \sigma'(\beta + S))。
证明:
若 (\alpha + S = \beta + S),则 (\alpha - \beta \in S)。因为 (S \subseteq W),所以 (\alpha - \beta \in W),因此
[
\alpha + W = \beta + W \implies \sigma'(\alpha + S) = \sigma'(\beta + S)
]
故σ'的定义与代表元的选择无关,是良定义的。□
3. 证明线性性
对任意 (\alpha + S, \beta + S \in V/S) 和任意 (\lambda \in F):
- 加法:(\sigma'((\alpha + S) + (\beta + S)) = \sigma'(\alpha + \beta + S) = \alpha + \beta + W = (\alpha + W) + (\beta + W) = \sigma'(\alpha + S) + \sigma'(\beta + S))
- 数乘:(\sigma'(\lambda(\alpha + S)) = \sigma'(\lambda \alpha + S) = \lambda \alpha + W = \lambda(\alpha + W) = \lambda \sigma'(\alpha + S))
因此σ'是线性映射。
4. 证明满射性
对任意 (\alpha + W \in V/W),存在 (\alpha + S \in V/S),使得
[
\sigma'(\alpha + S) = \alpha + W
]
故σ'是满射。
5. 计算核
[
\begin{align}
\ker \sigma' &= { \alpha + S \in V/S \mid \sigma'(\alpha + S) = 0 + W } \
&= { \alpha + S \mid \alpha + W = W } \
&= { \alpha + S \mid \alpha \in W } \
&= \frac{W}{S}
\end{align}
]
这里 (W/S) 确实是 (V/S) 的子空间,因为 (S \subseteq W)。
6. 应用第一同构定理
由第一同构定理,
[
\frac{V/S}{\ker \sigma'} \cong \operatorname{Im} \sigma'
]
代入 (\ker \sigma' = W/S) 和 (\operatorname{Im} \sigma' = V/W),得
[
\frac{V/S}{W/S} \cong \frac{V}{W}
]
□
三、几何直观例子
例:在三维空间 (V = \mathbb{R}^3) 中,取嵌套子空间:
- (S = \mathbb{R}\varepsilon_3 = \operatorname{span}{(0,0,1)})(z轴)
- (W = \text{xOz平面} = \operatorname{span}{(1,0,0), (0,0,1)})
根据第三同构定理:
[
\frac{\mathbb{R}^3}{\text{xOz平面}} \cong \frac{\mathbb{R}^3 / \text{z轴}}{\text{xOz平面} / \text{z轴}}
]
验证:
- 左边:(\dim(\mathbb{R}^3 / \text{xOz平面}) = 3 - 2 = 1),同构于 (\mathbb{R})(y轴)
- 右边:
- (\mathbb{R}^3 / \text{z轴} \cong \mathbb{R}^2)(xOy平面)
- (\text{xOz平面} / \text{z轴} \cong \mathbb{R})(x轴)
- 因此 (\frac{\mathbb{R}^2}{\text{x轴}} \cong \mathbb{R})(y轴)
两边都同构于实数轴,定理成立。
直观理解:
- 直接压缩:把xOz平面压缩成一个点,剩下的是平行于y轴的直线,对应y坐标。
- 分步压缩:先把z轴压缩成一个点得到xOy平面,再把x轴压缩成一个点,剩下的也是平行于y轴的直线,对应y坐标。
两种压缩方式得到的结果完全相同。
四、直和商空间的同构
推论:设 (V = V_1 \oplus V_2) 是直和,(W_1 \subseteq V_1),(W_2 \subseteq V_2) 是子空间,则 (W = W_1 \oplus W_2) 也是直和,且有自然同构:
[
\frac{V_1 \oplus V_2}{W_1 \oplus W_2} \cong \frac{V_1}{W_1} \oplus \frac{V_2}{W_2}
]
证明:
定义映射 (\sigma: V_1 \oplus V_2 \rightarrow \frac{V_1}{W_1} \oplus \frac{V_2}{W_2}),
[
\sigma(\alpha_1 + \alpha_2) = (\alpha_1 + W_1, \alpha_2 + W_2)
]
- 线性性:显然,σ是线性映射。
- 满射性:对任意 ((\alpha_1 + W_1, \alpha_2 + W_2)),都有 (\sigma(\alpha_1 + \alpha_2) = (\alpha_1 + W_1, \alpha_2 + W_2)),故σ是满射。
- 核的计算:
[
\ker \sigma = { \alpha_1 + \alpha_2 \mid \alpha_1 + W_1 = W_1 \text{ 且 } \alpha_2 + W_2 = W_2 } = { \alpha_1 + \alpha_2 \mid \alpha_1 \in W_1 \text{ 且 } \alpha_2 \in W_2 } = W_1 \oplus W_2
]
由第一同构定理,
[
\frac{V_1 \oplus V_2}{\ker \sigma} \cong \operatorname{Im} \sigma \implies \frac{V_1 \oplus V_2}{W_1 \oplus W_2} \cong \frac{V_1}{W_1} \oplus \frac{V_2}{W_2}
]
□
应用例子:
我们之前的经典例子 (\mathbb{R}^3 / \mathbb{R}\varepsilon_3 \cong \mathbb{R}^2) 就是这个推论的直接应用:
- (\mathbb{R}^3 = \mathbb{R}^2 \oplus \mathbb{R}\varepsilon_3)
- (W_1 = {0} \subseteq \mathbb{R}^2),(W_2 = \mathbb{R}\varepsilon_3 \subseteq \mathbb{R}\varepsilon_3)
- 因此 (\frac{\mathbb{R}^2 \oplus \mathbb{R}\varepsilon_3}{{0} \oplus \mathbb{R}\varepsilon_3} \cong \frac{\mathbb{R}^2}{{0}} \oplus \frac{\mathbb{R}\varepsilon_3}{\mathbb{R}\varepsilon_3} \cong \mathbb{R}^2 \oplus {0} \cong \mathbb{R}^2)
五、注记:商群与商环
商空间的概念可以自然推广到更一般的代数结构:
- 商群:设 (V) 是加法阿贝尔群,(W) 是其子群,则同余类全体 (V/W) 构成加法群,称为商群。运算定义为 (\overline{\alpha} + \overline{\beta} = \overline{\alpha + \beta})。
- 商环:设 (V) 是环,(W) 是其理想(加法子群且满足吸收律:对任意 (a \in V, w \in W),有 (aw \in W)),则商群 (V/W) 还可以定义乘法 (\overline{\alpha} \cdot \overline{\beta} = \overline{\alpha \beta}),构成环,称为商环。
例子:整数环 (\mathbb{Z}) 模7的商环 (\mathbb{Z}/7\mathbb{Z}),就是我们熟悉的模7剩余类环。
重要结论:三大同构定理不仅适用于线性空间,也完全适用于群、环、模等几乎所有代数结构,是整个代数学的核心定理。
六、三大同构定理总结
我们现在已经学完了线性代数的三大同构定理,它们构成了线性空间结构理论的完整体系:
| 定理 | 内容 | 核心思想 |
|---|---|---|
| 第一同构定理 | (V / \ker \psi \cong \operatorname{Im} \psi) | 同态的像同构于定义域对核的商 |
| 第二同构定理 | (\frac{W_1 + W_2}{W_2} \cong \frac{W_1}{W_1 \cap W_2}) | 和的商同构于子空间对交的商 |
| 第三同构定理 | (\frac{V}{W} \cong \frac{V/S}{W/S}) | 商的商同构于原空间的商 |
关系:第一同构定理是基础,第二和第三同构定理都是第一同构定理的直接推论。
核心价值:这三个定理提供了一种"化整为零"的通用方法论,通过将复杂的代数结构分解为简单的子结构和商结构,来研究其性质。它们是所有后续代数理论(如群论、环论、模论、同调代数等)的基石。
posted on 2026-05-01 22:25 Indian_Mysore 阅读(0) 评论(0) 收藏 举报
浙公网安备 33010602011771号