1.欧氏空间的映射
欧氏空间的映射与微分 完整讲解与推导
我将以60余年微分几何教学与研究的经验,从基础概念出发,逐层拆解知识点,完成完整的定理证明,最后用表格系统归纳核心内容,帮你搭建起微分几何最核心的“局部线性化”思维框架。
一、前置基础:m维欧氏空间的定义与记号
微分几何的研究载体是欧氏空间,我们先明确最基础的概念与记号规范,这是后续所有内容的基石。
1.1 欧氏空间的定义
设 \(\mathbb{R}^m\) 是m个有序实数组的全体,其中的元素(称为点)记为:
关键记号说明:这里的上标 \(i\) 是坐标指标,不是幂次!这是微分几何的通用记号规范,区分逆变/协变指标,初学者务必注意和幂运算区分。
对 \(\mathbb{R}^m\) 中任意两点 \(x=(x^1,\dots,x^m)\)、\(y=(y^1,\dots,y^m)\),定义欧氏距离:
该距离满足度量空间三公理(非负性、对称性、三角不等式),因此赋予欧氏距离的 \(\mathbb{R}^m\) 成为度量空间,称为m维欧氏空间,常用 \(E^m\) 表示,后续无混淆时不再区分 \(\mathbb{R}^m\) 和 \(E^m\)。
1.2 点与向量的等同
坐标全为0的点 \(O=(0,0,\dots,0)\) 称为原点。任意点 \(x\in\mathbb{R}^m\) 都可看作从原点出发的向量,向量的长度就是 \(\|x\|=\|x-O\|\)。
这一等同是核心:欧氏空间中的点可以做线性运算(加法、数乘),为后续“微分是线性映射”的定义提供了代数基础。
二、欧氏空间之间的映射:分量表示
我们研究的核心对象,是从m维欧氏空间的开子集到n维欧氏空间的映射,先明确映射的表示方法。
2.1 映射的基本定义
设 \(U\) 是 \(\mathbb{R}^m\) 的开子集(开集保证每个点都有邻域包含在 \(U\) 中,可做局部极限运算,是微分局部性的要求),定义映射:
其中定义域的点 \(x=(x^1,\dots,x^m)\in U\subset\mathbb{R}^m\),像点 \(y=(y^1,\dots,y^n)\in\mathbb{R}^n\)。
2.2 投影映射与分量函数
为了把高维映射转化为我们熟悉的多元函数,引入投影映射:
投影映射是线性、连续的,作用是提取 \(\mathbb{R}^n\) 中点的第 \(\alpha\) 个坐标。
借助投影映射,我们可以把映射 \(F\) 拆解为分量函数:对每个 \(\alpha=1,\dots,n\),定义
即 \(f^\alpha(x)=\pi^\alpha(F(x))\),\(f^\alpha\) 是定义在 \(U\) 上的m元实值函数,称为映射 \(F\) 的第 \(\alpha\) 个分量函数。
由此,映射 \(F\) 可以完全表示为分量函数的形式:
核心结论:欧氏空间之间的映射,与一组多元实值函数一一对应。反过来,任意n个定义在 \(U\) 上的m元函数 \(f^1,\dots,f^n\),都能唯一确定一个映射 \(F:U\to\mathbb{R}^n\)。这一对应把高维映射的研究,完全转化为多元函数的研究。
2.3 经典特例:\(\mathbb{R}^n\) 中的参数曲线
当 \(m=1\) 时,\(U\) 是 \(\mathbb{R}\) 中的开区间 \((a,b)\),此时映射
就是 \(\mathbb{R}^n\) 中的参数曲线,\(t\) 为参数。这是微分几何曲线论的核心研究对象,也是映射的最基础实例。
三、映射的可微性定义
我们已经熟悉一元函数、多元实函数的可微性,现在将其推广到欧氏空间的映射。
3.1 多元实函数可微的回顾
先回顾m元实函数 \(f:U\to\mathbb{R}\)(\(U\subset\mathbb{R}^m\) 开集)在点 \(a\in U\) 可微的定义:
存在常数 \(C_1,C_2,\dots,C_m\),使得
且满足 \(\lim\limits_{x\to a} r(x,a)=0\)。
其中常数 \(C_i\) 就是 \(f\) 在 \(a\) 点对 \(x^i\) 的偏导数 \(\frac{\partial f}{\partial x^i}\bigg|_{x=a}\),线性项就是全微分。
3.2 映射可微性的定义
映射的可微性,是逐分量定义的,完全由其分量函数的可微性决定:
定义1.1.1 映射的可微性
设 \(U\subset\mathbb{R}^m\) 是开集,\(F:U\to\mathbb{R}^n\) 是映射,\(a\in U\)。
- 若 \(F\) 的每一个分量函数 \(f^1,f^2,\dots,f^n\) 都在点 \(a\) 处可微,则称映射 \(F\) 在点 \(a\) 处可微;
- 若每个分量函数 \(f^\alpha\) 在 \(a\) 点的所有 \(\leq k\) 阶偏导数都存在且连续,则称 \(F\) 在 \(a\) 点是\(C^k\) 映射(k阶连续可微);
- 若每个分量函数都任意阶连续可微(\(C^\infty\)),则称 \(F\) 为光滑映射;
- 若每个分量函数都可展开为收敛的幂级数(\(C^\omega\)),则称 \(F\) 为实解析映射。
若 \(F\) 在开集 \(U\) 的每一点都满足上述性质,则称 \(F\) 在 \(U\) 上可微(\(C^k/C^\infty/C^\omega\))。
四、Jacobi矩阵(雅可比矩阵):微分的矩阵表示
映射的可微性由分量函数的偏导数决定,我们将这些偏导数排成矩阵,就得到了映射的核心工具——Jacobi矩阵,它是映射微分的矩阵表示。
4.1 Jacobi矩阵的定义
设 \(U\subset\mathbb{R}^m\) 是开集,\(F:U\to\mathbb{R}^n\) 在 \(U\) 上可微,对任意 \(x\in U\),定义n行m列的矩阵:
该矩阵称为映射 \(F\) 在 \(x\) 点的Jacobi矩阵,简记为 \(DF(x)\) 或 \(F'(x)\)。
4.2 核心说明
- 维度规则:Jacobi矩阵的行数=像空间维数 \(n\),列数=定义域维数 \(m\),对应 \(\mathbb{R}^m\to\mathbb{R}^n\) 的线性映射;
- 元素规则:第 \(\alpha\) 行第 \(i\) 列的元素,是第 \(\alpha\) 个分量函数 \(f^\alpha\) 对第 \(i\) 个坐标 \(x^i\) 的偏导数 \(\frac{\partial f^\alpha}{\partial x^i}\),行对应分量,列对应变量;
- 光滑性对应:若 \(F\) 是 \(C^k\) 映射,则其Jacobi矩阵的所有元素都是 \(U\) 上的 \(C^{k-1}\) 函数;
- 经典特例:
- 当 \(n=1\) 时,\(F\) 是m元实函数,Jacobi矩阵是 \(1\times m\) 行矩阵,即函数的梯度 \(\nabla f\);
- 当 \(m=n=1\) 时,\(F\) 是一元函数,Jacobi矩阵是 \(1\times1\) 矩阵,元素就是一元函数的导数 \(f'(x)\);
- 当 \(m=1\) 时,\(F\) 是 \(\mathbb{R}^n\) 中的参数曲线,Jacobi矩阵是 \(n\times1\) 列矩阵,元素就是曲线的切向量 \((\frac{df^1}{dt},\dots,\frac{df^n}{dt})\)。
五、核心定理:映射可微的充要条件(完整证明)
这个定理是整个内容的核心,它揭示了微分的本质:用线性映射局部逼近非线性映射,将一元函数可微的核心思想,完整推广到高维映射。
5.1 定理内容
定理1.1.1 设 \(U\) 是 \(\mathbb{R}^m\) 的开子集,映射 \(F:U\to\mathbb{R}^n\),点 \(a\in U\)。则 \(F\) 在点 \(a\) 处可微的充要条件是:
存在一个线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),以及n维向量值函数 \(R(x,a)=(r^1(x,a),r^2(x,a),\dots,r^n(x,a))\),使得\[F(x) = F(a) + A(x-a) + \|x-a\| R(x,a) \tag{1.1.4} \]且满足极限条件
\[\lim_{x\to a} \|R(x,a)\| = 0 \tag{1.1.5} \]
5.2 定理的意义
这个式子的本质是:在点 \(a\) 附近,非线性映射 \(F\) 可以分解为三部分:
- \(F(a)\):常数平移项;
- \(A(x-a)\):线性映射项,也就是 \(F\) 在 \(a\) 点的微分,是对非线性映射的线性逼近;
- \(\|x-a\| R(x,a)\):高阶无穷小余项,当 \(x\to a\) 时,余项是比 \(\|x-a\|\) 更高阶的无穷小。
一句话总结:映射在一点可微,等价于它在该点可以被线性映射“完美逼近”,误差为高阶无穷小。
5.3 前置引理:向量范数极限与分量极限的等价性
证明前先证明一个核心引理,它是连接向量值极限和分量极限的桥梁:
对 \(\mathbb{R}^n\) 中的向量值函数 \(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),有
引理证明:
- 必要性(\(\Rightarrow\)):若 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),则对任意 \(\alpha\),有
由夹逼准则,\(\lim\limits_{x\to a} r^\alpha(x,a)=0\)。
- 充分性(\(\Leftarrow\)):若对所有 \(\alpha\),\(\lim\limits_{x\to a} r^\alpha(x,a)=0\),则
因此 \(\lim\limits_{x\to a} \|R(x,a)\|=0\)。
引理证毕。
5.4 定理的完整证明
我们分必要性和充分性两部分完成证明,无任何跳步。
第一部分:必要性(\(\Rightarrow\)):若F在a点可微,则满足定理条件
已知:\(F\) 在 \(a\) 点可微,即每个分量函数 \(f^\alpha\) 都在 \(a\) 点可微。
根据多元实函数可微的定义,对每个 \(\alpha=1,\dots,n\),存在常数 \(C_1^\alpha,C_2^\alpha,\dots,C_m^\alpha\),使得
且满足 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\),其中 \(C_i^\alpha = \frac{\partial f^\alpha}{\partial x^i}\bigg|_{x=a}\)(多元函数可微必可偏导,全微分系数为偏导数)。
现在将n个分量的式子(*)整合为向量形式:
- 左边:\(F(x)=(f^1(x),f^2(x),\dots,f^n(x))\),常数项 \(F(a)=(f^1(a),\dots,f^n(a))\);
- 线性项:将系数 \(C_i^\alpha\) 排成 \(n\times m\) 矩阵 \(A=(A_{\alpha i})\),其中 \(A_{\alpha i}=C_i^\alpha=\frac{\partial f^\alpha}{\partial x^i}\bigg|_{x=a}\)。
对向量 \(h=x-a=(x^1-a^1,\dots,x^m-a^m)\),线性映射 \(A(h)\) 的第 \(\alpha\) 个分量为 \(\sum_{i=1}^m A_{\alpha i} h^i = \sum_{i=1}^m C_i^\alpha (x^i-a^i)\),因此整个线性项为 \(A(x-a)\); - 余项项:将分量余项整合为向量 \(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),则整体余项为 \(\|x-a\| R(x,a)\)。
将三部分合并,得到:
即式(1.1.4)。
再验证极限条件:由每个 \(f^\alpha\) 可微,得 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\),根据前置引理,直接推出 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),即式(1.1.5)。
必要性证毕。
第二部分:充分性(\(\Leftarrow\)):若满足定理条件,则F在a点可微
已知:存在线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\) 和向量值函数 \(R(x,a)\),使得式(1.1.4)和(1.1.5)成立。
我们需要证明:\(F\) 的每个分量函数 \(f^\alpha\) 都在 \(a\) 点可微,从而 \(F\) 在 \(a\) 点可微。
首先,将式(1.1.4)按分量展开:设线性映射 \(A\) 对应的矩阵为 \((A_{\alpha i})\),\(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),则式(1.1.4)的第 \(\alpha\) 个分量为:
由已知条件 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),根据前置引理,对所有 \(\alpha=1,\dots,n\),有 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\)。
此时式()完全符合m元实函数可微的定义**:存在常数 \(A_{\alpha 1},\dots,A_{\alpha m}\),使得 \(f^\alpha(x)\) 可表示为常数项+线性项+\(\|x-a\|\) 乘以趋于0的函数,因此每个 \(f^\alpha\) 都在 \(a\) 点可微。
根据映射可微的定义,所有分量函数可微,则映射 \(F\) 在 \(a\) 点可微。
充分性证毕。
综上,必要性与充分性均成立,定理得证。
5.5 核心推论:微分的唯一性
满足定理条件的线性映射 \(A\) 是唯一的,它就是 \(F\) 在 \(a\) 点的Jacobi矩阵对应的线性映射,称为 \(F\) 在 \(a\) 点的微分,记为 \(dF_a\) 或 \(DF(a)\)。
唯一性证明:若存在两个线性映射 \(A_1,A_2\) 都满足定理条件,则两式相减得:
两边除以 \(\|x-a\|\),令 \(x\to a\),右边趋于0,左边对任意单位向量 \(h\) 都有 \((A_1-A_2)(h)=0\),因此 \(A_1-A_2\) 是零映射,即 \(A_1=A_2\)。
六、核心知识点系统归纳表
| 知识点分类 | 名称 | 定义/数学表达式 | 核心说明与备注 |
|---|---|---|---|
| 基础空间概念 | m维欧氏空间 \(\mathbb{R}^m\)(\(E^m\)) | 全体m元有序实数组的集合,元素 \(x=(x^1,\dots,x^m)\); 欧氏距离 \(d(x,y)=|x-y|=\left[\sum_{i=1}^m (x^i-y^i)^2\right]^{1/2}\) |
1. 上标为坐标指标,非幂次; 2. 赋予欧氏距离后成为度量空间; 3. 点与原点出发的向量等同,可做线性运算 |
| 映射的表示 | 欧氏空间的映射 \(F\) | \(U\subset\mathbb{R}^m\) 为开集,\(F:U\to\mathbb{R}^n\),\(x\mapsto F(x)\) | 定义域为开集,保证局部极限运算可进行,符合微分的局部性 |
| 映射的表示 | 投影映射 \(\pi^\alpha\) | \(\pi^\alpha:\mathbb{R}^n\to\mathbb{R}\),\(\pi^\alpha(y^1,\dots,y^n)=y^\alpha\) | 线性连续映射,用于将高维映射拆解为分量函数 |
| 映射的表示 | 分量函数 \(f^\alpha\) | \(f^\alpha=\pi^\alpha\circ F:U\to\mathbb{R}\),映射可表示为 \(F(x)=(f^1(x),\dots,f^n(x))\) | 1. 每个 \(f^\alpha\) 是m元实值函数; 2. 映射与n个分量函数一一对应,将高维问题转化为多元函数问题 |
| 映射的表示 | 特例:\(\mathbb{R}^n\) 中的参数曲线 | \(m=1\),\(U=(a,b)\),\(F:(a,b)\to\mathbb{R}^n\),\(t\mapsto F(t)=(f^1(t),\dots,f^n(t))\) | 微分几何曲线论的核心研究对象,Jacobi矩阵对应曲线的切向量 |
| 可微性定义 | 映射的可微性 | 若 \(F\) 的每个分量函数 \(f^\alpha\) 都在 \(a\in U\) 可微,则称 \(F\) 在 \(a\) 处可微 | 映射的可微性是逐分量定义的,完全由分量函数的可微性决定 |
| 可微性定义 | \(C^k\) 映射(k阶连续可微) | 每个分量函数的所有 \(\leq k\) 阶偏导数都存在且连续 | 1. \(C^0\) 为连续映射,\(C^1\) 为一阶连续可微; 2. \(C^k\) 映射的Jacobi矩阵元素为 \(C^{k-1}\) 函数 |
| 可微性定义 | 光滑映射(\(C^\infty\) 映射) | 每个分量函数任意阶连续可微 | 微分几何最常用的映射类,是流形光滑结构的基础 |
| 可微性定义 | 实解析映射(\(C^\omega\) 映射) | 每个分量函数可展开为收敛的幂级数 | 光滑性强于 \(C^\infty\),是性质最好的可微映射 |
| 核心矩阵 | Jacobi矩阵 \(DF(x)\) | \(n\times m\) 矩阵,\(\frac{\partial(f^1,\dots,f^n)}{\partial(x^1,\dots,x^m)}=\left[\frac{\partial f^\alpha}{\partial x^i}\right]_{n\times m}\) | 1. 行数=像空间维数n,列数=定义域维数m; 2. 是微分 \(dF_x\) 的矩阵表示; 3. \(n=1\) 时为梯度,\(m=n=1\) 时为一元函数导数 |
| 核心定理 | 映射可微的充要条件 | \(F\) 在 \(a\) 可微 \(\iff\) 存在唯一线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),使得: 1. \(F(x)=F(a)+A(x-a)+|x-a|R(x,a)\); 2. \(\lim\limits_{x\to a}|R(x,a)|=0\) |
1. 揭示微分的本质:用线性映射局部逼近非线性映射,余项为高阶无穷小; 2. 唯一的线性映射 \(A\) 就是微分 \(dF_a\),矩阵为 \(DF(a)\); 3. 是一元函数可微定义的高维推广,是链规则的理论基础 |
| 核心推论 | 微分的唯一性 | 满足定理条件的线性映射 \(A\) 唯一,等于Jacobi矩阵对应的线性映射 | 保证微分的定义是良定的,无歧义 |
最终总结
这部分内容是微分几何的“微积分基石”,核心完成了两个关键推广:
- 把一元/多元实函数,推广到高维欧氏空间之间的映射,通过分量函数实现了高维问题到多元函数问题的转化;
- 把一元函数的导数、多元函数的全微分,推广到高维映射的微分——一个线性映射,核心思想是局部线性化,这个思想贯穿了整个微分几何,后续流形的切映射、子流形的嵌入、微分形式的外微分,都是基于这个核心思想展开的。
欧氏空间映射的链规则与光滑截断函数 完整讲解与证明
承接上一节映射可微性的核心结论,我们继续讲解微分的核心运算性质——复合映射的链规则,以及微分几何中至关重要的光滑截断函数定理,这两部分内容是从局部微分性质过渡到整体几何构造的核心基础。
一、微分与Jacobi矩阵的对应关系
上一节我们证明了:映射 \(F:U\to\mathbb{R}^n\) 在点 \(a\in U\) 可微的充要条件是存在唯一的线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),使得
现在我们明确这个唯一线性映射的具体形式。
1.1 微分的矩阵表示
对可微映射 \(F\),其分量函数为 \(f^\alpha(x)\ (\alpha=1,\dots,n)\),根据多元函数可微的性质,全微分的系数就是偏导数,即式中线性项的系数
因此线性映射 \(A\) 对应的 \(n\times m\) 矩阵 \((A_{\alpha i})\) 的元素为
这个矩阵正是 \(F\) 在 \(a\) 点的Jacobi矩阵,记为 \(DF(a)\)。
我们将这个唯一的线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\) 称为映射 \(F\) 在 \(a\) 点的微分,也用 \(DF(a)\) 表示(矩阵与线性映射一一对应,无混淆时共用记号)。
由此,映射可微的核心表达式可以改写为:
核心意义:这个式子是一元函数微分公式 \(f(x)=f(a)+f'(a)(x-a)+o(x-a)\) 在高维映射的完整推广。微分 \(DF(a)\) 就是一元函数导数的高维对应,它是一个线性映射,实现了定义域的切空间到像空间的切空间的线性变换,这是后续流形切映射的核心原型。
二、复合映射的链规则定理(定理1.1.2)
链规则是微分运算的核心性质,它揭示了复合映射的微分等于微分的复合,对应到矩阵就是Jacobi矩阵的乘积。
2.1 复合映射的定义
设 \(U\subset\mathbb{R}^m\)、\(V\subset\mathbb{R}^n\) 为开子集,给定两个映射:
- \(F:U\to V\),\(x\mapsto y=F(x)\),分量函数为 \(f^1(x),\dots,f^n(x)\);
- \(G:V\to\mathbb{R}^p\),\(y\mapsto z=G(y)\),分量函数为 \(g^1(y),\dots,g^p(y)\)。
则定义复合映射 \(H=G\circ F:U\to\mathbb{R}^p\),满足
其分量函数为多元函数的复合:
2.2 链规则定理的内容
定理1.1.2(链规则定理)
若映射 \(F\) 在点 \(a\in U\) 可微,映射 \(G\) 在点 \(b=F(a)\in V\) 可微,则复合映射 \(H=G\circ F\) 在点 \(a\) 可微,且其微分满足\[DH(a) = DG(F(a)) \cdot DF(a) \tag{1.1.7} \]若 \(F\) 在 \(U\) 上、\(G\) 在 \(V\) 上分别可微,则 \(H\) 在 \(U\) 上可微,且式(1.1.7)对任意 \(a\in U\) 成立。
核心解读:
- 维度匹配:\(DF(a)\) 是 \(n\times m\) 矩阵,\(DG(b)\) 是 \(p\times n\) 矩阵,二者乘积是 \(p\times m\) 矩阵,恰好是 \(DH(a)\) 的维度(\(H:\mathbb{R}^m\to\mathbb{R}^p\)),完全匹配;
- 本质意义:复合映射的微分,就是两个微分的复合(线性映射的复合对应矩阵的乘法),这说明微分运算保持复合结构,是微分几何中“局部线性化”思想的核心体现;
- 分量形式:对应到偏导数,就是多元函数复合求导的链规则:\(\frac{\partial h^\lambda}{\partial x^i}(a) = \sum_{\alpha=1}^n \frac{\partial g^\lambda}{\partial y^\alpha}(b) \cdot \frac{\partial f^\alpha}{\partial x^i}(a)\),和矩阵乘法的元素计算完全一致。
2.3 定理的完整证明
我们将证明分为表达式展开、余项拆分、高阶无穷小验证三个步骤,无任何跳步。
步骤1:利用可微性展开两个映射
记 \(b=F(a)\),\(y=F(x)\)。
由 \(F\) 在 \(a\) 点可微,得:
其中 \(\lim\limits_{x\to a} \|R_F(x,a)\| = 0\)。
由 \(G\) 在 \(b\) 点可微,得:
其中 \(\lim\limits_{y\to b} \|R_G(y,b)\| = 0\)。
而 \(H(x)-H(a)=G(F(x))-G(F(a))=G(y)-G(b)\),将式(1)代入式(2),得:
步骤2:整理余项,统一形式
我们将后两项合并为余项,提取公因子 \(\|x-a\|\):
其中余项
根据定理1.1.1,我们只需证明 \(\lim\limits_{x\to a} \|R_H(x,a)\| = 0\),即可证明 \(H\) 在 \(a\) 点可微,且微分 \(DH(a)=DG(b)\cdot DF(a)\)。
步骤3:验证余项的极限为0
我们分别估计余项的两部分的范数,利用三角不等式 \(\|A+B\| \leq \|A\| + \|B\|\),只需证明两部分都趋于0即可。
第一部分:\(\| DG(b) R_F(x,a) \|\) 的极限
矩阵的范数满足相容性不等式:对任意矩阵 \(M\) 和向量 \(v\),有 \(\|Mv\| \leq \|M\| \cdot \|v\|\)(这里 \(\|M\|\) 是矩阵的Frobenius范数,即所有元素平方和的平方根,是常数)。
因此:
由 \(F\) 可微,\(\lim\limits_{x\to a} \|R_F(x,a)\|=0\),而 \(\|DG(b)\|\) 是与 \(x\) 无关的常数,因此
第二部分:\(\left\| \frac{\|F(x)-F(a)\|}{\|x-a\|} R_G(y,b) \right\|\) 的极限
首先估计 \(\frac{\|F(x)-F(a)\|}{\|x-a\|}\) 的有界性:
由式(1),根据三角不等式:
两边除以 \(\|x-a\|\),得:
对线性映射 \(DF(a)\),\(\frac{\|DF(a)(x-a)\|}{\|x-a\|} \leq \|DF(a)\|\)(矩阵范数的定义),因此:
当 \(x\to a\) 时,\(\|R_F(x,a)\|\to0\),因此这个分式在 \(x\to a\) 时是有界量,极限为 \(\|DF(a)\|\)。
再看 \(R_G(y,b)\):当 \(x\to a\) 时,\(F(x)\to F(a)=b\)(可微必连续),即 \(y\to b\),因此由 \(G\) 的可微性,\(\lim\limits_{x\to a} \|R_G(y,b)\| = \lim\limits_{y\to b} \|R_G(y,b)\| = 0\)。
因此,有界量乘以无穷小量仍为无穷小量,即:
最终余项极限
两部分都趋于0,因此由三角不等式:
根据定理1.1.1,\(H\) 在 \(a\) 点可微,且微分 \(DH(a)=DG(F(a))\cdot DF(a)\)。
定理证毕。
2.4 链规则的推论:\(C^k\) 映射的复合封闭性
推论 若 \(F\) 在 \(U\) 上、\(G\) 在 \(V\) 上都是 \(C^k\) 映射(k阶连续可微),则复合映射 \(H=G\circ F\) 在 \(U\) 上也是 \(C^k\) 映射。
证明(仅证k=1的情况,一般情况用数学归纳法推广):
当 \(F,G\) 都是 \(C^1\) 映射时,根据定义:
- \(F\) 的Jacobi矩阵 \(DF\) 的所有元素 \(\frac{\partial f^\alpha}{\partial x^i}\) 都是 \(U\) 上的连续函数;
- \(G\) 的Jacobi矩阵 \(DG\) 的所有元素 \(\frac{\partial g^\lambda}{\partial y^\alpha}\) 都是 \(V\) 上的连续函数。
根据链规则,\(DH=DG(F(x))\cdot DF(x)\),矩阵乘积的元素是两个矩阵元素的乘积之和,即:
其中:
- \(\frac{\partial g^\lambda}{\partial y^\alpha}(F(x))\) 是连续函数的复合,仍为连续函数;
- \(\frac{\partial f^\alpha}{\partial x^i}(x)\) 是连续函数;
- 有限个连续函数的乘积、和仍为连续函数。
因此 \(DH\) 的所有元素都是 \(U\) 上的连续函数,即 \(H\) 的分量函数的一阶偏导数连续,故 \(H\) 是 \(C^1\) 映射。
对一般的 \(k>1\),可通过数学归纳法:假设 \(k-1\) 时结论成立,对 \(k\) 阶偏导数,其本质是一阶偏导数的 \(k-1\) 阶偏导,因此仍保持连续性,故结论成立。
三、光滑截断函数定理(定理1.1.3)
这个定理是微分几何中局部性质推广到整体性质的核心工具,它保证了我们可以用光滑函数“截断”一个局部定义的函数,将其延拓到整个空间,同时保持光滑性,是单位分解定理的基础。
3.1 定理内容
定理1.1.3 设 \(C\subset\mathbb{R}^n\) 是闭集,\(K\subset\mathbb{R}^n\) 是紧集,且 \(C\cap K=\emptyset\)(二者不相交),则存在一个 \(C^\infty\) 函数 \(\sigma:\mathbb{R}^n\to\mathbb{R}\),满足:
- 值域 \(\sigma(\mathbb{R}^n)\subset[0,1]\);
- 在紧集 \(K\) 上,\(\sigma(x)\equiv1\);
- 在闭集 \(C\) 上,\(\sigma(x)\equiv0\)。
3.2 定理的完整证明
证明分为两步:第一步构造局部光滑隆起函数(bump函数),第二步利用紧集的有限覆盖性质构造全局的截断函数。
步骤1:构造局部光滑隆起函数
我们先证明:对任意 \(a\in\mathbb{R}^n\),\(\varepsilon>0\),存在 \(C^\infty\) 函数 \(g:\mathbb{R}^n\to\mathbb{R}\),满足:
- 在闭球 \(\overline{B_{\varepsilon/2}(a)}\) 上,\(g(x)\equiv1\);
- 在开球 \(B_\varepsilon(a)\) 上,\(g(x)>0\);
- 在开球 \(B_\varepsilon(a)\) 的外部,\(g(x)\equiv0\)。
其中 \(B_r(a)=\{x\in\mathbb{R}^n\mid \|x-a\|<r\}\) 是以 \(a\) 为中心、\(r\) 为半径的开球,\(\overline{B_r(a)}\) 是对应的闭球。
子步骤1.1:构造一元光滑函数 \(h(t)\)
定义一元函数:
我们先证明 \(h(t)\) 是 \(\mathbb{R}\) 上的 \(C^\infty\) 函数:
- 当 \(t<0\) 时,\(h(t)=0\),任意阶导数都是0,光滑;
- 当 \(t>0\) 时,\(h(t)=e^{-1/t}\) 是初等函数的复合,任意阶可导,光滑;
- 关键验证 \(t=0\) 处的光滑性:用数学归纳法可证明,\(h(t)\) 在 \(t=0\) 处的任意阶右导数都为0,即 \(h^{(k)}(0)=0,\ \forall k\in\mathbb{N}\)。因此 \(h(t)\) 在整个 \(\mathbb{R}\) 上任意阶连续可导,是 \(C^\infty\) 函数。
子步骤1.2:构造径向光滑函数 \(\tilde{g}(x)\)
定义函数 \(\tilde{g}:\mathbb{R}^n\to\mathbb{R}\):
我们验证它的性质:
-
分母恒不为0:对任意 \(x\in\mathbb{R}^n\),\(\varepsilon^2 - \|x\|^2\) 和 \(\|x\|^2 - \varepsilon^2/4\) 不可能同时≤0:
- 若 \(\varepsilon^2 - \|x\|^2 \leq0\),则 \(\|x\|^2\geq\varepsilon^2\),此时 \(\|x\|^2 - \varepsilon^2/4 \geq \varepsilon^2 - \varepsilon^2/4 = 3\varepsilon^2/4 >0\),故 \(h\left(\|x\|^2 - \varepsilon^2/4\right)>0\);
- 若 \(\|x\|^2 - \varepsilon^2/4 \leq0\),则 \(\|x\|^2\leq\varepsilon^2/4\),此时 \(\varepsilon^2 - \|x\|^2 \geq \varepsilon^2 - \varepsilon^2/4 = 3\varepsilon^2/4 >0\),故 \(h(\varepsilon^2 - \|x\|^2)>0\)。
因此分母始终为正,\(\tilde{g}(x)\) 是良定的。
-
光滑性:\(h(t)\) 是 \(C^\infty\) 函数,\(\|x\|^2\) 是多项式(\(C^\infty\)),因此分子、分母都是 \(C^\infty\) 函数,且分母恒不为0,故 \(\tilde{g}(x)\) 是 \(\mathbb{R}^n\) 上的 \(C^\infty\) 函数。
-
取值性质:
- 当 \(\|x\| \leq \varepsilon/2\) 时,\(\|x\|^2 - \varepsilon^2/4 \leq0\),故 \(h\left(\|x\|^2 - \varepsilon^2/4\right)=0\),因此 \(\tilde{g}(x)=\frac{h(\varepsilon^2 - \|x\|^2)}{h(\varepsilon^2 - \|x\|^2)}=1\);
- 当 \(\|x\| < \varepsilon\) 时,\(\varepsilon^2 - \|x\|^2 >0\),故 \(h(\varepsilon^2 - \|x\|^2)>0\),因此 \(\tilde{g}(x)>0\);
- 当 \(\|x\| \geq \varepsilon\) 时,\(\varepsilon^2 - \|x\|^2 \leq0\),故 \(h(\varepsilon^2 - \|x\|^2)=0\),因此 \(\tilde{g}(x)=0\)。
子步骤1.3:平移得到目标函数
令 \(g(x)=\tilde{g}(x-a)\),则 \(g(x)\) 就是我们需要的函数:
- 在 \(\overline{B_{\varepsilon/2}(a)}\) 上,\(g(x)\equiv1\);
- 在 \(B_\varepsilon(a)\) 上,\(g(x)>0\);
- 在 \(B_\varepsilon(a)\) 外,\(g(x)\equiv0\);
- 且 \(g(x)\) 是 \(C^\infty\) 函数。
步骤2:利用有限覆盖构造全局截断函数
已知 \(C\) 是闭集,故 \(\mathbb{R}^n - C\) 是开集;又 \(K\) 是紧集,且 \(K\cap C=\emptyset\),因此 \(K\subset \mathbb{R}^n - C\)。
根据紧集的有限覆盖定理:开集 \(\mathbb{R}^n - C\) 覆盖了紧集 \(K\),因此存在有限个开球 \(B_{\varepsilon_i}(a_i)\ (i=1,2,\dots,s)\),满足:
- 每个 \(B_{\varepsilon_i}(a_i) \subset \mathbb{R}^n - C\);
- 有限个开球覆盖 \(K\),即 \(K\subset \bigcup_{i=1}^s B_{\varepsilon_i/2}(a_i)\)。
对每个开球 \(B_{\varepsilon_i}(a_i)\),我们用步骤1构造对应的 \(C^\infty\) 函数 \(g_i(x)\),满足:
- 在 \(\overline{B_{\varepsilon_i/2}(a_i)}\) 上,\(g_i(x)\equiv1\);
- 在 \(B_{\varepsilon_i}(a_i)\) 上,\(g_i(x)>0\);
- 在 \(B_{\varepsilon_i}(a_i)\) 外,\(g_i(x)\equiv0\)。
现在定义函数:
我们验证 \(\sigma(x)\) 满足定理的所有条件:
-
光滑性:每个 \(g_i(x)\) 是 \(C^\infty\) 函数,因此 \((1-g_i(x))\) 是 \(C^\infty\) 函数,有限个 \(C^\infty\) 函数的乘积、和仍为 \(C^\infty\) 函数,故 \(\sigma(x)\) 是 \(\mathbb{R}^n\) 上的 \(C^\infty\) 函数。
-
值域为 \([0,1]\):对任意 \(x\),\(0\leq g_i(x)\leq1\),故 \(0\leq 1-g_i(x)\leq1\),因此 \(0\leq \prod_{i=1}^s (1-g_i(x)) \leq1\),故 \(0\leq \sigma(x)\leq1\)。
-
在 \(K\) 上 \(\sigma(x)\equiv1\):对任意 \(x\in K\),由覆盖性质,存在某个 \(i\) 使得 \(x\in B_{\varepsilon_i/2}(a_i)\),因此 \(g_i(x)=1\),故 \((1-g_i(x))=0\),因此乘积 \(\prod_{i=1}^s (1-g_i(x))=0\),故 \(\sigma(x)=1-0=1\)。
-
在 \(C\) 上 \(\sigma(x)\equiv0\):对任意 \(x\in C\),\(x\notin \mathbb{R}^n - C\),因此 \(x\notin B_{\varepsilon_i}(a_i)\) 对所有 \(i\) 成立,故 \(g_i(x)=0\) 对所有 \(i\) 成立,因此 \((1-g_i(x))=1\),乘积 \(\prod_{i=1}^s (1-g_i(x))=1\),故 \(\sigma(x)=1-1=0\)。
综上,\(\sigma(x)\) 满足定理的所有要求,定理证毕。
3.3 推论:局部光滑函数的全局延拓
推论 设 \(f(x)\) 是开集 \(U\subset\mathbb{R}^n\) 上的 \(C^k\) 函数,\(a\in U\),则存在 \(a\) 的一个邻域 \(W\subset U\),以及 \(\mathbb{R}^n\) 上的 \(C^k\) 函数 \(f^*:\mathbb{R}^n\to\mathbb{R}\),满足:
- 在邻域 \(W\) 上,\(f^*(x)=f(x)\);
- 在 \(U\) 的外部,\(f^*(x)\equiv0\)。
这个推论的意义是:开集上的局部光滑函数,可以光滑地延拓到整个欧氏空间,且在原定义域外恒为0,这是将局部定义的几何量推广到整体的核心工具。
证明:
-
选取邻域:因为 \(U\) 是开集,\(a\in U\),因此存在 \(a\) 的两个邻域 \(V_1,V_2\),满足 \(\overline{V_1} \subset V_2 \subset \overline{V_2} \subset U\),且 \(\overline{V_1}\) 是紧集(例如取足够小的开球即可)。
-
构造截断函数:令 \(K=\overline{V_1}\)(紧集),\(C=\mathbb{R}^n - V_2\)(闭集),显然 \(K\cap C=\emptyset\),满足定理1.1.3的条件。因此存在 \(C^\infty\) 函数 \(\sigma(x):\mathbb{R}^n\to[0,1]\),满足:
- 在 \(K=\overline{V_1}\) 上,\(\sigma(x)\equiv1\);
- 在 \(C=\mathbb{R}^n - V_2\) 上,\(\sigma(x)\equiv0\)。
-
定义延拓函数:
-
验证良定性与光滑性:
- 良定性:\((\mathbb{R}^n - \overline{V_2}) \cap U = U - \overline{V_2}\),在这个集合上,\(\sigma(x)\equiv0\),因此 \(\sigma(x)f(x)=0\),和第二部分的定义一致,函数是良定的。
- 光滑性:
- 在开集 \(U\) 上,\(\sigma(x)\) 是 \(C^\infty\) 函数,\(f(x)\) 是 \(C^k\) 函数,乘积是 \(C^k\) 函数;
- 在开集 \(\mathbb{R}^n - \overline{V_2}\) 上,\(f^*(x)\equiv0\),是 \(C^\infty\) 函数;
- 整个 \(\mathbb{R}^n\) 被这两个开集覆盖,因此 \(f^*(x)\) 在整个 \(\mathbb{R}^n\) 上是 \(C^k\) 函数。
-
验证延拓性质:
- 取 \(W=V_1\),则在 \(W\) 上,\(\sigma(x)\equiv1\),故 \(f^*(x)=1\cdot f(x)=f(x)\);
- 在 \(U\) 外,\(x\in \mathbb{R}^n - U \subset \mathbb{R}^n - \overline{V_2}\),故 \(f^*(x)\equiv0\)。
推论证毕。
四、核心知识点系统归纳表
| 知识点分类 | 名称 | 核心内容 | 关键性质与几何意义 |
|---|---|---|---|
| 微分的表示 | 微分与Jacobi矩阵的对应 | 可微映射 \(F\) 在 \(a\) 点的微分 \(DF(a)\) 是唯一的线性映射,对应的矩阵是Jacobi矩阵,元素为 \(A_{\alpha i}=\frac{\partial f^\alpha}{\partial x^i}(a)\) | 1. 是一元函数导数的高维推广; 2. 实现了定义域到像空间的线性变换,是流形切映射的原型; 3. 可微表达式为 \(F(x)=F(a)+DF(a)(x-a)+o(|x-a|)\) |
| 复合映射 | 复合映射的定义 | \(F:U\to V\subset\mathbb{R}^n\),\(G:V\to\mathbb{R}^p\),复合 \(H=G\circ F:U\to\mathbb{R}^p\),分量为 \(h^\lambda(x)=g^\lambda(f^1(x),\dots,f^n(x))\) | 高维映射的复合等价于多元函数的逐分量复合,是微分几何中映射复合的基础形式 |
| 核心定理 | 链规则定理 | 若 \(F\) 在 \(a\) 可微,\(G\) 在 \(F(a)\) 可微,则 \(H=G\circ F\) 在 \(a\) 可微,且 \(DH(a)=DG(F(a))\cdot DF(a)\) | 1. 复合映射的微分=微分的复合,对应Jacobi矩阵的乘积; 2. 是多元函数复合求导的高维推广,保证微分运算的复合封闭性; 3. 维度匹配:\(p\times m = (p\times n)\cdot(n\times m)\) |
| 核心推论 | \(C^k\) 映射的复合封闭性 | \(C^k\) 映射的复合仍为 \(C^k\) 映射 | 1. 一阶连续可微映射的复合,一阶偏导数仍连续; 2. 光滑映射(\(C^\infty\))的复合仍为光滑映射,是光滑流形范畴的核心性质 |
| 核心工具 | 光滑截断函数定理 | 不相交的紧集 \(K\) 和闭集 \(C\),存在 \(C^\infty\) 函数 \(\sigma:\mathbb{R}^n\to[0,1]\),在 \(K\) 上恒为1,\(C\) 上恒为0 | 1. 是微分几何局部→整体的核心工具,是单位分解定理的基础; 2. 证明了非平凡光滑隆起函数的存在性,区别于实解析函数(实解析函数无法做到局部恒1、局部恒0) |
| 工具推论 | 局部光滑函数的全局延拓 | 开集 \(U\) 上的 \(C^k\) 函数,可延拓为整个 \(\mathbb{R}^n\) 上的 \(C^k\) 函数,且在 \(U\) 外恒为0 | 解决了局部定义的函数的光滑延拓问题,是将局部几何性质推广到整体流形的关键技术 |
最终总结
这部分内容完成了微分几何微积分基础的两大核心构建:
- 微分的运算性质:通过链规则定理,明确了复合映射的微分运算规则,将一元函数的求导法则完整推广到高维映射,建立了微分运算的代数结构;
- 整体化的工具基础:通过光滑截断函数定理,证明了光滑函数的“局部截断-全局延拓”性质,这是微分几何区别于复几何、实解析几何的核心特征——我们可以通过光滑函数灵活地拼接局部构造,实现从局部性质到整体性质的过渡,这也是后续流形上的积分、联络、曲率等整体几何研究的基础。
反函数定理与隐函数定理 完整讲解与证明
我将以微分几何的核心视角,从基础拓扑概念出发,逐层拆解微分同胚的核心定义,完整证明收缩映射引理(不动点定理),再分步骤完成反函数定理的严谨证明,最后推导其推论与隐函数定理,帮你建立起“局部线性可逆→局部微分同胚”的核心逻辑链条。
一、前置基础概念:映射的拓扑与光滑性质
反函数定理的核心是研究映射的局部可逆性,我们先明确从集合映射到光滑映射的层级概念。
1.1 集合映射的基本性质
设 \(A,B\) 为两个集合,映射 \(F:A\to B\),我们定义三类核心映射性质:
- 满射( surjective ):若 \(F(A)=B\),即 \(B\) 中每个元素都有原像,称 \(F\) 为满射;
- 单射( injective ):若对任意 \(x_1,x_2\in A\),\(x_1\neq x_2\) 必有 \(F(x_1)\neq F(x_2)\),即不同的点映射到不同的像,称 \(F\) 为单射(一一映射);
- 双射( bijective ):若 \(F\) 既是满射又是单射,称 \(F\) 为双射。
核心结论:映射 \(F:A\to B\) 存在逆映射 \(F^{-1}:B\to A\) 的充要条件是 \(F\) 为双射。逆映射满足 \(F\circ F^{-1}=\text{id}_B\),\(F^{-1}\circ F=\text{id}_A\),其中 \(\text{id}\) 为恒等映射。
1.2 同胚:拓扑等价
设 \(A,B\) 为拓扑空间(此处为欧氏空间的开子集),若 \(F:A\to B\) 是双射,且 \(F\) 和其逆映射 \(F^{-1}\) 都是连续映射,则称 \(F\) 为同胚(homeomorphism)。
同胚是拓扑学的核心等价关系:两个集合同胚,意味着它们在拓扑意义下完全等价,开集、闭集、紧性、连通性等拓扑性质在同胚下完全保持。
1.3 微分同胚:光滑等价
这是微分几何的核心等价关系,在同胚的基础上增加了光滑性要求。
定义1.1.2 \(C^k\)-微分同胚
设 \(U,V\) 是 \(\mathbb{R}^m\) 中的开集,映射 \(F:U\to V\) 满足:
- \(F\) 是同胚(双射+双向连续);
- \(F\) 和其逆映射 \(F^{-1}\) 都是 \(C^k\) 映射(\(k\geq1\),即k阶连续可微)。
则称 \(F\) 为\(C^k\)-微分同胚,称 \(U\) 和 \(V\) 是 \(C^k\)-微分同胚的。当 \(k=\infty\) 时,简称为微分同胚。
核心说明
- 等价关系:微分同胚是 \(\mathbb{R}^m\) 中开子集之间的等价关系,满足:
- 反身性:恒等映射 \(\text{id}:U\to U\) 是微分同胚;
- 对称性:若 \(F:U\to V\) 是微分同胚,则 \(F^{-1}:V\to U\) 也是微分同胚;
- 传递性:若 \(F:U\to V\)、\(G:V\to W\) 都是微分同胚,则复合 \(G\circ F:U\to W\) 也是微分同胚(引理1)。
- 几何意义:两个开集微分同胚,意味着它们不仅拓扑等价,而且光滑结构完全一致,后续流形的定义就是基于“局部与欧氏空间微分同胚”这一核心。
1.4 微分同胚的经典例子
例1 平移映射
设 \(F:\mathbb{R}^m\to\mathbb{R}^m\) 是从点 \(a=(a^1,\dots,a^m)\) 到 \(b=(b^1,\dots,b^m)\) 的平移映射:
- 光滑性:分量函数都是一次多项式,是实解析(\(C^\omega\))映射,自然是 \(C^\infty\) 的;
- 逆映射:\(F^{-1}(x)=x+(a-b)\),同样是平移映射,也是 \(C^\infty\) 的;
- 同胚性:平移是双射,且双向连续。
因此平移映射是微分同胚。
例2 可逆线性变换
设 \(F:\mathbb{R}^m\to\mathbb{R}^m\) 是齐次线性变换:
其中 \(A=(a_j^i)_{m\times m}\) 是 \(m\) 阶方阵。
- Jacobi矩阵:直接计算得 \(DF(x)=A\),与 \(x\) 无关;
- 微分同胚的充要条件:\(F\) 是微分同胚 \(\iff\) \(\det A\neq0\)(\(A\) 非奇异/可逆)。
- 充分性:若 \(\det A\neq0\),则逆矩阵 \(A^{-1}\) 存在,逆映射 \(F^{-1}(x)=A^{-1}\cdot x\) 也是线性变换,\(F\) 是双射,且 \(F,F^{-1}\) 都是 \(C^\infty\) 的,故为微分同胚;
- 必要性:若 \(\det A=0\),则 \(A\) 是降秩矩阵,存在非零向量 \(x\) 使得 \(F(x)=0\),故 \(F\) 不是单射,不可能是双射,更不是微分同胚。
关键启示:线性变换是微分同胚的充要条件是其微分(Jacobi矩阵)可逆。反函数定理的核心,就是把这个线性映射的结论,推广到非线性映射的局部——只要某点的微分可逆,那么映射在该点的局部就是微分同胚。
二、核心工具:收缩映射定理(不动点定理)
反函数定理的证明依赖于这个泛函分析的核心引理,它保证了方程解的存在性与唯一性。
2.1 定理内容
引理2 收缩映射定理
设 \(M\) 是完备度量空间,度量为 \(d(x,y)\),映射 \(T:M\to M\) 是收缩映射:存在常数 \(\lambda\in[0,1)\),使得对任意 \(x,y\in M\),有\[d(T(x),T(y)) \leq \lambda \cdot d(x,y) \]则 \(T\) 在 \(M\) 中存在唯一的不动点 \(a\),即满足 \(T(a)=a\)。
2.2 完整证明
证明分为不动点的存在性和唯一性两部分。
步骤1:构造柯西列,证明存在性
任取初始点 \(x_0\in M\),定义迭代序列:
我们先证明 \(\{x_n\}\) 是柯西列。
对任意正整数 \(n,m\),由收缩映射的性质,重复应用不等式得:
因此对 \(x_{n+m}=T^n(x_m)\),有:
对 \(d(x_0,x_m)\) 用三角不等式展开:
这里用到了等比数列求和,且 \(0\leq\lambda<1\),故无穷和收敛。
代入 \(d(x_n,x_{n+m})\) 的估计式,得:
其中 \(K=\frac{d(x_0,T(x_0))}{1-\lambda}\) 是与 \(n,m\) 无关的常数。
由于 \(0\leq\lambda<1\),当 \(n\to\infty\) 时,\(\lambda^n\to0\),因此对任意 \(\varepsilon>0\),存在足够大的 \(N\),当 \(n>N\) 时,\(d(x_n,x_{n+m})<\varepsilon\) 对所有 \(m\) 成立。故 \(\{x_n\}\) 是柯西列。
因为 \(M\) 是完备度量空间,柯西列必收敛,记 \(\lim\limits_{n\to\infty} x_n = a\)。
接下来证明 \(a\) 是不动点:由收缩映射的定义,\(T\) 是连续映射(Lipschitz连续必连续),因此
即 \(T(a)=a\),不动点存在。
步骤2:证明不动点的唯一性
假设存在两个不同的不动点 \(a,b\),即 \(T(a)=a\),\(T(b)=b\),且 \(a\neq b\),则 \(d(a,b)>0\)。
由收缩映射的性质:
两边除以 \(d(a,b)>0\),得 \(1\leq\lambda\),与 \(\lambda<1\) 的假设矛盾。因此不动点唯一。
定理证毕。
三、核心定理:反函数定理(定理1.1.4)
反函数定理是多元微积分与微分几何的基石,它给出了非线性映射局部可逆的充要条件,建立了“局部线性性质→局部非线性性质”的桥梁。
3.1 定理内容
定理1.1.4 反函数定理
设 \(U\) 是 \(\mathbb{R}^m\) 的开集,\(F:U\to\mathbb{R}^m\) 是 \(C^k\)(\(k\geq1\))映射。若点 \(a\in U\) 处的Jacobi矩阵 \(DF(a)\) 非奇异(即可逆,\(\det DF(a)\neq0\)),则:
- 存在 \(a\) 的开邻域 \(W\subset U\),使得 \(F:W\to F(W)=V\) 是 \(C^k\) 微分同胚;
- 对任意 \(x\in W\),记 \(y=F(x)\),则逆映射 \(F^{-1}\) 在 \(y\) 处的微分为
\[DF^{-1}(y) = \left( DF(x) \right)^{-1} \tag{1.1.9} \]其中 \((DF(x))^{-1}\) 是Jacobi矩阵 \(DF(x)\) 的逆矩阵。
3.2 定理的核心解读
- 局部性:定理只保证局部微分同胚,即使 \(DF\) 在整个 \(U\) 上处处非奇异,也不能保证 \(F\) 在全局是微分同胚(例如 \(F:\mathbb{R}^2\to\mathbb{R}^2\),\(F(x,y)=(e^x\cos y,e^x\sin y)\),\(DF\) 处处可逆,但不是单射,因为 \(F(x,y+2\pi)=F(x,y)\));
- 光滑性保持:原映射是 \(C^k\) 的,逆映射也一定是 \(C^k\) 的,光滑性双向保持;
- 微分公式:逆映射的微分是原映射微分的逆,这是一元函数反函数求导公式 \((f^{-1})'(y)=\frac{1}{f'(x)}\) 在高维的完整推广,线性映射的逆对应矩阵的逆。
3.3 定理的完整证明
我们将证明分为6个步骤,每一步都明确动机与逻辑。
步骤1:标准化处理,简化问题
动机:通过平移和可逆线性变换,将一般情况简化为最简洁的标准情形:\(F(0)=0\),\(DF(0)=I\)(单位矩阵),不改变定理的结论。
具体操作:
设原映射 \(F\) 在 \(a\) 点满足 \(F(a)=b\),\(DF(a)=A\)(\(A\) 可逆)。我们构造两个微分同胚:
- 平移映射 \(\tau_1:\mathbb{R}^m\to\mathbb{R}^m\),\(\tau_1(x)=x+a\),将原点映射到 \(a\);
- 可逆线性变换 \(\tau_2:\mathbb{R}^m\to\mathbb{R}^m\),\(\tau_2(y)=A^{-1}(y-b)\),将 \(b\) 映射到原点,且将 \(DF(a)=A\) 变为单位矩阵。
定义复合映射:
则 \(\tilde{F}\) 满足:
- \(\tilde{F}(0) = \tau_2(F(\tau_1(0))) = \tau_2(F(a)) = \tau_2(b) = 0\);
- 由链规则,\(D\tilde{F}(0) = A^{-1} \cdot DF(a) \cdot I = A^{-1}A = I\);
- \(\tilde{F}\) 也是 \(C^k\) 映射,且由微分同胚的传递性,\(F\) 在 \(a\) 附近是局部微分同胚 \(\iff\) \(\tilde{F}\) 在原点附近是局部微分同胚。
因此,我们只需对 \(F(0)=0\),\(DF(0)=I\) 的情形证明定理即可。
现在定义辅助映射:
显然有:
- \(G(0)=0-F(0)=0\);
- \(DG(x)=I-DF(x)\),故 \(DG(0)=I-DF(0)=0\)(零矩阵)。
步骤2:选取合适的邻域,证明G是压缩映射
动机:我们需要找到一个闭球邻域,使得 \(G\) 是压缩映射,为后续用收缩映射定理做准备,同时得到 \(F\) 的Lipschitz估计。
具体操作:
因为 \(F\) 是 \(C^k\)(\(k\geq1\))映射,故 \(DF(x)\)、\(DG(x)\) 的所有元素都是 \(x\) 的连续函数。
已知 \(DF(0)=I\)(\(\det DF(0)=1\neq0\)),\(DG(0)=0\),由连续性,存在实数 \(r>0\),使得:
- 闭球 \(\overline{B_{2r}(0)} \subset U\),且在 \(\overline{B_{2r}(0)}\) 上,\(\det DF(x)\neq0\)(\(DF(x)\) 处处非奇异);
- 在闭球 \(\overline{B_r(0)}\) 上,\(DG(x)\) 的所有元素的绝对值都不超过 \(\frac{1}{2m}\)(\(m\) 是空间维数)。
现在证明:对任意 \(x_1,x_2\in\overline{B_r(0)}\),有
证明:对 \(G\) 的每个分量函数 \(g^i(x)\),由多元函数的微分中值定理,存在 \(\theta\in(0,1)\),使得
由柯西不等式:
因此,\(G\) 的范数满足:
式(1.1.11)得证,即 \(G\) 在 \(\overline{B_r(0)}\) 上是压缩系数为 \(\frac{1}{2}\) 的压缩映射。
接下来推导 \(F\) 的Lipschitz下界估计:
由 \(G(x)=x-F(x)\),得 \(F(x)=x-G(x)\),因此
由三角不等式 \(\|a-b\| \geq |\|a\|-\|b\||\),得:
整理得:
这个不等式说明 \(F\) 在 \(\overline{B_r(0)}\) 上是单射(若 \(F(x_1)=F(x_2)\),则 \(x_1=x_2\))。
步骤3:用收缩映射定理证明局部逆映射的存在性与唯一性
动机:对每个目标点 \(y\),我们将方程 \(F(x)=y\) 转化为不动点问题,用收缩映射定理证明解的存在唯一性。
具体操作:
首先证明:对任意 \(x\in\overline{B_r(0)}\),有 \(\|G(x)\| \leq \frac{r}{2}\)。
在式(1.1.11)中令 \(x_1=x\),\(x_2=0\),得:
而 \(G(0)=0\),故 \(\|G(x)\| \leq \frac{1}{2}\|x\|\)。当 \(\|x\|\leq r\) 时,\(\|G(x)\| \leq \frac{r}{2}\),即 \(G(\overline{B_r(0)}) \subset \overline{B_{\frac{r}{2}}(0)}\)。
现在,对任意固定的 \(y\in\overline{B_{\frac{r}{2}}(0)}\),定义映射:
首先验证 \(T_y\) 确实将 \(\overline{B_r(0)}\) 映射到自身:对任意 \(x\in\overline{B_r(0)}\),
故 \(T_y(x)\in\overline{B_r(0)}\)。
再验证 \(T_y\) 是压缩映射:对任意 \(x_1,x_2\in\overline{B_r(0)}\),
压缩系数 \(\lambda=\frac{1}{2}<1\),满足收缩映射定理的条件。
而 \(\overline{B_r(0)}\) 是完备度量空间(欧氏空间的闭子集是完备的),因此由收缩映射定理,\(T_y\) 在 \(\overline{B_r(0)}\) 中存在唯一的不动点 \(x\),即
这说明:对每个 \(y\in\overline{B_{\frac{r}{2}}(0)}\),存在唯一的 \(x\in\overline{B_r(0)}\) 使得 \(F(x)=y\)。由此我们得到了逆映射:
满足 \(F\circ F^{-1}(y)=y\) 对所有 \(y\in\overline{B_{\frac{r}{2}}(0)}\) 成立。
步骤4:证明F是局部同胚
动机:我们已经得到了逆映射,现在需要证明 \(F\) 是同胚,即 \(F\) 是开映射,且逆映射连续。
具体操作:
令 \(W=F^{-1}(B_{\frac{r}{2}}(0))\),\(V=B_{\frac{r}{2}}(0)\)(开球)。
- \(W\) 是开集:因为 \(F\) 是连续映射,开集的原像是开集,\(V=B_{\frac{r}{2}}(0)\) 是开集,故 \(W=F^{-1}(V)\) 是开集,且 \(W\subset\overline{B_r(0)}\subset U\),即 \(W\) 是 \(a=0\) 的开邻域。
- \(F:W\to V\) 是双射:由步骤3,对每个 \(y\in V\),存在唯一的 \(x\in W\) 使得 \(F(x)=y\),故 \(F\) 是双射。
- 逆映射 \(F^{-1}:V\to W\) 连续:对任意 \(y_1,y_2\in V\),记 \(x_1=F^{-1}(y_1)\),\(x_2=F^{-1}(y_2)\),由式(1.1.12)的Lipschitz估计:
这说明 \(F^{-1}\) 是Lipschitz连续的,自然是连续映射。
综上,\(F:W\to V\) 是双射+双向连续,即同胚。
步骤5:证明逆映射的可微性与微分公式
动机:我们已经证明了 \(F\) 是同胚,现在需要证明逆映射 \(F^{-1}\) 是可微的,且满足微分公式(1.1.9)。
具体操作:
任取 \(b=F(a)\in V\),我们证明 \(F^{-1}\) 在 \(b\) 点可微,且 \(DF^{-1}(b)=(DF(a))^{-1}\)。
因为 \(F\) 在 \(a\) 点可微,由可微的定义,有:
其中 \(\lim\limits_{x\to a} \|R(x,a)\|=0\)。
记 \(y=F(x)\),\(b=F(a)\),则 \(x=F^{-1}(y)\),\(a=F^{-1}(b)\)。因为 \(DF(a)\) 可逆,记 \(B=(DF(a))^{-1}\),用 \(B\) 左乘式(*)两边,得:
将 \(x=F^{-1}(y)\),\(a=F^{-1}(b)\) 代入,整理得:
这正是逆映射可微的定义形式,我们只需证明余项是高阶无穷小。令余项:
我们验证 \(\lim\limits_{y\to b} \|r(y,b)\|=0\):
- 由式(1.1.12),\(\frac{\|F^{-1}(y)-F^{-1}(b)\|}{\|y-b\|} \leq 2\),是有界量;
- \(B\) 是常数矩阵,\(\|B\|\) 是常数;
- 当 \(y\to b\) 时,\(F^{-1}\) 连续,故 \(x=F^{-1}(y)\to a=F^{-1}(b)\),因此 \(\lim\limits_{y\to b} \|R(F^{-1}(y),F^{-1}(b))\| = \lim\limits_{x\to a} \|R(x,a)\|=0\)。
有界量乘以无穷小量仍为无穷小量,故 \(\lim\limits_{y\to b} \|r(y,b)\|=0\)。
根据映射可微的充要条件(定理1.1.1),\(F^{-1}\) 在 \(b\) 点可微,且微分就是线性映射 \(B=(DF(a))^{-1}\),即
微分公式得证。
步骤6:证明逆映射是 \(C^k\) 的
动机:我们已经证明了逆映射是 \(C^1\) 的,现在需要证明它和原映射有相同的光滑性,即原映射是 \(C^k\) 的,逆映射也是 \(C^k\) 的。
具体操作:
我们用数学归纳法证明:
-
基例 \(k=1\):原映射 \(F\) 是 \(C^1\) 的,即 \(DF(x)\) 的元素都是连续函数。
由微分公式,\(DF^{-1}(y) = (DF(F^{-1}(y)))^{-1}\)。
逆矩阵的元素是原矩阵元素的有理函数(伴随矩阵除以行列式),是 \(C^\infty\) 函数;\(DF\) 的元素是连续的,\(F^{-1}\) 是连续的,因此复合后 \(DF^{-1}(y)\) 的元素都是连续函数,故 \(F^{-1}\) 是 \(C^1\) 的。 -
归纳步骤:假设当原映射是 \(C^l\)(\(l<k\))时,逆映射也是 \(C^l\) 的。
若原映射 \(F\) 是 \(C^{l+1}\) 的,则 \(DF(x)\) 的元素是 \(C^l\) 的。由归纳假设,\(F^{-1}\) 是 \(C^l\) 的,因此 \(DF^{-1}(y)=(DF(F^{-1}(y)))^{-1}\) 的元素是 \(C^l\) 函数的复合,也是 \(C^l\) 的,故 \(F^{-1}\) 是 \(C^{l+1}\) 的。
由数学归纳法,对任意 \(k\geq1\),若 \(F\) 是 \(C^k\) 的,则 \(F^{-1}\) 也是 \(C^k\) 的。
综上,我们证明了 \(F:W\to V\) 是 \(C^k\) 微分同胚,且逆映射的微分公式成立,定理证毕。
四、反函数定理的推论与隐函数定理
4.1 反函数定理的两个核心推论
推论1 开映射性质
若 \(DF\) 在开集 \(U\) 上处处非奇异,则 \(F\) 是开映射:它将 \(U\) 中的任意开集都映射为 \(\mathbb{R}^m\) 中的开集。
证明:对任意开集 \(U'\subset U\),任取 \(y\in F(U')\),则存在 \(x\in U'\) 使得 \(F(x)=y\)。由反函数定理,存在 \(x\) 的开邻域 \(W\subset U'\),使得 \(F(W)\) 是开集,且 \(y\in F(W)\subset F(U')\)。因此 \(y\) 是 \(F(U')\) 的内点,由 \(y\) 的任意性,\(F(U')\) 是开集。
推论2 全局微分同胚的充要条件
\(C^k\) 映射 \(F:U\to F(U)\) 是 \(C^k\) 微分同胚的充要条件是:\(F\) 是单射,且 \(DF\) 在 \(U\) 的每一点都非奇异。
证明:
- 必要性:若 \(F\) 是微分同胚,则 \(F\) 是单射,且对任意 \(x\in U\),\(DF(x)\) 可逆(否则逆映射的微分不存在),故 \(DF\) 处处非奇异。
- 充分性:若 \(F\) 是单射,且 \(DF\) 处处非奇异,则由反函数定理,\(F\) 是局部微分同胚,逆映射局部光滑;又 \(F\) 是单射,故全局逆映射存在,且局部光滑意味着全局光滑,因此 \(F\) 是全局微分同胚。
4.2 隐函数定理
隐函数定理是反函数定理的直接推论,它解决了“方程 \(f(x,y)=0\) 何时能确定 \(y\) 为 \(x\) 的函数”这一核心问题,是微分几何中曲面、子流形定义的基础。
定理内容
定理1.1.5 隐函数定理
设 \(U\subset\mathbb{R}^m\)、\(V\subset\mathbb{R}^n\) 是开集,映射 \(f:U\times V\to\mathbb{R}^n\) 是 \(C^k\)(\(k\geq1\))映射。若对 \(x_0\in U\),\(y_0\in V\),满足:
- \(f(x_0,y_0)=0\);
- 映射 \(y\mapsto f(x_0,y)\) 在 \(y_0\) 处的微分 \(D_2 f(x_0,y_0)\) 非奇异(即可逆,\(\det D_2 f(x_0,y_0)\neq0\),其中 \(D_2 f\) 是 \(f\) 对第二个变量 \(y\) 的Jacobi矩阵)。
则存在 \(x_0\) 的开邻域 \(U_0\subset U\),以及唯一的 \(C^k\) 映射 \(g:U_0\to V\),满足:
- \(g(x_0)=y_0\);
- 对所有 \(x\in U_0\),有 \(f(x,g(x))=f(x_0,y_0)=0\)。
完整证明
核心思路:构造一个辅助映射,将隐函数问题转化为反函数定理的适用场景。
具体操作:
构造辅助映射 \(F:U\times V\to\mathbb{R}^m\times\mathbb{R}^n\),
我们计算 \(F\) 在 \((x_0,y_0)\) 处的Jacobi矩阵:
其中 \(I_m\) 是 \(m\) 阶单位矩阵,\(D_1 f\) 是 \(f\) 对第一个变量 \(x\) 的Jacobi矩阵。
这是分块上三角矩阵,其行列式等于对角块行列式的乘积:
因此 \(DF(x_0,y_0)\) 非奇异,满足反函数定理的条件。
由反函数定理,存在 \((x_0,y_0)\) 的开邻域 \(U_0\times V_0\subset U\times V\),使得 \(F:U_0\times V_0\to F(U_0\times V_0)\) 是 \(C^k\) 微分同胚,其逆映射 \(F^{-1}\) 也是 \(C^k\) 的。
注意到 \(F(x_0,y_0)=(x_0,f(x_0,y_0))=(x_0,0)\),因此逆映射 \(F^{-1}\) 定义在 \((x_0,0)\) 的开邻域上,形式为:
其中 \(\varphi\) 是 \(C^k\) 映射,满足 \(F(x,\varphi(x,z))=(x,z)\),即 \(f(x,\varphi(x,z))=z\)。
现在定义映射 \(g:U_0\to V\),
则 \(g\) 是 \(C^k\) 映射,且:
- \(g(x_0)=\varphi(x_0,0)=y_0\),因为 \(F^{-1}(x_0,0)=(x_0,y_0)\);
- 对所有 \(x\in U_0\),\(f(x,g(x))=f(x,\varphi(x,0))=0\),满足方程。
唯一性:若存在另一个映射 \(\tilde{g}\) 满足条件,则对任意 \(x\in U_0\),\(F(x,g(x))=(x,0)=F(x,\tilde{g}(x))\),而 \(F\) 是单射,故 \(g(x)=\tilde{g}(x)\),唯一性得证。
定理证毕。
五、核心知识点系统归纳表
| 知识点分类 | 名称 | 核心定义/定理内容 | 关键性质与几何意义 |
|---|---|---|---|
| 基础映射概念 | 单射/满射/双射 | 单射:不同点映射到不同像;满射:像覆盖整个目标集;双射:单射+满射 | 双射是逆映射存在的充要条件,是可逆性的集合论基础 |
| 基础映射概念 | 同胚 | 双射+双向连续的映射 | 拓扑等价关系,保持所有拓扑性质(开集、紧性、连通性等) |
| 基础映射概念 | \(C^k\)-微分同胚 | 同胚+双向\(C^k\)(k阶连续可微)的映射 | 微分几何的核心等价关系,光滑流形的定义基础,保持拓扑与光滑结构 |
| 核心工具 | 收缩映射定理 | 完备度量空间上的压缩映射(压缩系数λ<1)存在唯一不动点 | 证明方程解的存在唯一性的核心工具,是反函数定理证明的基石 |
| 核心定理 | 反函数定理 | \(C^k\)映射\(F:U\to\mathbb{R}^m\),若\(a\)点\(DF(a)\)非奇异,则存在\(a\)的开邻域\(W\),使得\(F:W\to F(W)\)是\(C^k\)微分同胚,且\(DF^{-1}(y)=(DF(x))^{-1}\) | 1. 核心结论:局部线性可逆→局部微分同胚; 2. 是一元反函数求导的高维推广; 3. 仅保证局部可逆,不保证全局可逆 |
| 反函数定理推论 | 开映射定理 | 若\(DF\)在开集\(U\)上处处非奇异,则\(F\)是开映射 | 说明局部可逆的映射将开集映射为开集,是拓扑性质的重要结论 |
| 核心定理 | 隐函数定理 | \(C^k\)映射\(f:U\times V\to\mathbb{R}^n\),若\(f(x_0,y_0)=0\)且\(D_2f(x_0,y_0)\)非奇异,则局部存在唯一\(C^k\)映射\(g\)使得\(f(x,g(x))=0\),\(g(x_0)=y_0\) | 1. 是反函数定理的直接推论; 2. 解决了方程确定隐函数的问题; 3. 是欧氏空间中子流形、曲面定义的核心理论基础 |
最终总结
反函数定理与隐函数定理是连接线性代数与非线性分析的桥梁,是微分几何的“微积分基石”。它们的核心思想可以概括为一句话:只要一个光滑映射在某点的微分(线性近似)是可逆的,那么这个映射在该点的局部就是可逆的微分同胚,其局部行为完全由线性近似决定。
这一思想贯穿了整个微分几何:从欧氏空间的子流形,到抽象光滑流形的切映射、坐标变换,再到黎曼几何的局部坐标系构造,无一不是基于反函数定理提供的局部可逆性保证。
秩定理与Sard定理 完整讲解与证明
承接反函数定理的核心思想,我们继续讲解微分几何中两个核心的基础定理:秩定理与Sard定理。秩定理是反函数定理的重要推广,它刻画了常秩光滑映射的局部标准形,将线性代数的秩标准形推广到非线性场景;Sard定理则揭示了光滑映射临界点的测度性质,是微分拓扑的基石之一。
一、映射的秩的核心定义
我们首先明确映射的秩的概念,它是整个章节的基础。
定义1.1.3 映射的秩
设 \(U\) 是 \(\mathbb{R}^m\) 的开子集,\(F:U\to\mathbb{R}^n\) 是 \(C^k\)(\(k\geq1\))映射。
- 映射 \(F\) 在点 \(x\in U\) 的秩,定义为其Jacobi矩阵 \(DF(x)\) 在 \(x\) 点的秩;
- 若对开子集 \(W\subset U\) 中的每一个点 \(x\),\(F\) 的秩恒为常数 \(r\),则称 \(F\) 在 \(W\) 上的秩等于 \(r\)。
关键性质:秩在微分同胚复合下不变
若映射 \(F\) 与微分同胚做复合,则复合映射的秩与原映射的秩完全相等。
证明:设 \(u\) 是微分同胚,由链规则,复合映射 \(F\circ u^{-1}\) 的Jacobi矩阵为
微分同胚的Jacobi矩阵处处非奇异(可逆),而矩阵与可逆矩阵相乘不改变秩,因此 \(D(F\circ u^{-1})(x)\) 的秩与 \(DF(u^{-1}(x))\) 的秩相等。
这一性质是秩定理的核心基础:我们可以通过定义域和值域的微分同胚(坐标变换),将复杂的常秩映射化简为最简标准形。
二、秩定理(定理1.1.6)
秩定理是反函数定理的一般化:反函数定理处理的是满秩(\(r=m=n\))的情况,而秩定理处理任意常秩的情况,是线性代数中“秩标准形”的非线性推广。
2.1 定理内容
定理1.1.6 秩定理
设 \(A,B\) 分别为 \(\mathbb{R}^m,\mathbb{R}^n\) 中的开子集,\(F:A\to B\) 是 \(C^k\)(\(k\geq1\))映射,且 \(F\) 在 \(A\) 上的秩恒为常数 \(r\)。
对任意 \(a\in A\),记 \(b=F(a)\in B\),则存在:
- \(a\) 的开邻域 \(A_0\subset A\),\(b\) 的开邻域 \(B_0\subset B\);
- \(C^k\) 微分同胚 \(u:A_0\to U\subset\mathbb{R}^m\),\(v:B_0\to V\subset\mathbb{R}^n\);
使得复合映射 \(v\circ F\circ u^{-1}:U\to V\) 具有最简标准形:
\[v\circ F\circ u^{-1}(x^1,x^2,\dots,x^m) = (x^1,x^2,\dots,x^r,\underbrace{0,\dots,0}_{n-r\text{个}}) \tag{1.1.14} \]
2.2 定理的核心解读
- 线性代数的非线性推广:线性变换 \(T:\mathbb{R}^m\to\mathbb{R}^n\) 秩为 \(r\) 时,存在可逆矩阵 \(P,Q\) 使得 \(PTQ=\begin{pmatrix}I_r & 0 \\ 0 & 0\end{pmatrix}\)(秩标准形)。秩定理中,微分同胚 \(u\) 对应坐标变换 \(Q\),\(v\) 对应坐标变换 \(P\),将非线性的常秩映射局部化为线性的投影形式。
- 局部结构完全确定:常秩映射的局部行为完全由其秩决定,无论非线性项多复杂,都可以通过光滑坐标变换变成“前r个坐标保留,后n-r个坐标置零”的最简形式。
- 反函数定理是特例:当 \(r=m=n\) 时,标准形为 \(v\circ F\circ u^{-1}(x)=x\),即 \(F=v^{-1}\circ u\),是两个微分同胚的复合,本身也是局部微分同胚,与反函数定理的结论完全一致。
2.3 定理的完整证明
我们将证明分为4个核心步骤,每一步都明确动机与逻辑,无跳步。
步骤1:标准化处理,简化问题
动机:通过平移和坐标置换,将问题简化为最规整的情形:\(a,b\) 均为原点,且 \(DF(a)\) 的左上角 \(r\) 阶子式非奇异,不改变定理的结论。
具体操作:
- 平移坐标:令 \(x'=x-a\),\(y'=y-b\),则新的映射 \(F'(x')=F(x'+a)-b\) 满足 \(F'(0)=0\),且 \(DF'(0)=DF(a)\),秩仍为 \(r\),将 \(a,b\) 化为原点。
- 坐标置换:由于 \(DF(0)\) 的秩为 \(r\),必存在一个非零的 \(r\) 阶子式。通过置换坐标(置换坐标是微分同胚,不改变映射的秩),可让左上角的 \(r\) 阶子式非奇异,即:
步骤2:构造定义域的微分同胚 \(u\),“拉直”前r个分量
动机:我们希望将 \(F\) 的前 \(r\) 个分量转化为新的坐标,让前 \(r\) 个分量完全简化为坐标本身,为后续化简做准备。
具体操作:
定义 \(C^k\) 映射 \(u:A\to\mathbb{R}^m\):
我们验证 \(u\) 是局部微分同胚:
- \(u(0)=0\):因为 \(F(0)=0\),故 \(f^1(0)=\dots=f^r(0)=0\)。
- 计算 \(u\) 的Jacobi矩阵 \(Du(x)\),它是分块矩阵:
其中 \(I_{m-r}\) 是 \((m-r)\) 阶单位矩阵,左下角为零矩阵。
分块三角矩阵的行列式等于对角块行列式的乘积,因此 \(\det Du(x) = \det\left(\frac{\partial f^\alpha}{\partial x^i}\right)_{\alpha,i=1}^r\)。由步骤1,在 \(x=0\) 处该行列式非零,故 \(Du(0)\) 非奇异。
根据反函数定理,存在原点的开邻域 \(A_1\subset A\),使得 \(u:A_1\to u(A_1)=U_1\) 是 \(C^k\) 微分同胚。
步骤3:化简复合映射,证明后段分量仅依赖前r个坐标
动机:我们已经得到了定义域的坐标变换 \(u\),现在分析复合映射 \(F\circ u^{-1}\) 的形式,证明其后面的分量仅与前 \(r\) 个坐标有关,与后 \(m-r\) 个坐标无关。
具体操作:
设 \(u^{-1}(x^1,\dots,x^m)=z\),即 \(u(z)=(f^1(z),\dots,f^r(z),z^{r+1},\dots,z^m)=(x^1,\dots,x^m)\),因此 \(F(z)=(f^1(z),\dots,f^r(z),f^{r+1}(z),\dots,f^n(z))\)。
代入 \(z=u^{-1}(x)\),得复合映射:
其中 \(\bar{f}^{r+j}(x) = f^{r+j}(u^{-1}(x))\),\(j=1,2,\dots,n-r\)。
接下来证明:\(\bar{f}^{r+j}(x)\) 仅依赖前 \(r\) 个坐标 \(x^1,\dots,x^r\),与 \(x^{r+1},\dots,x^m\) 无关。
计算 \(F\circ u^{-1}\) 的Jacobi矩阵,它是分块矩阵:
由于 \(u\) 是微分同胚,\(F\circ u^{-1}\) 的秩与 \(F\) 的秩相等,恒为 \(r\)。而该矩阵的前 \(r\) 行已经是线性无关的(包含单位矩阵 \(I_r\)),因此整个矩阵的秩为 \(r\) 的充要条件是:右下角的 \((n-r)\times(m-r)\) 矩阵的所有元素全为0,即
偏导数恒为0,说明 \(\bar{f}^{r+j}(x)\) 不依赖 \(x^{r+1},\dots,x^m\),仅与 \(x^1,\dots,x^r\) 有关,即
步骤4:构造值域的微分同胚 \(v\),得到最简标准形
动机:现在 \(F\circ u^{-1}\) 的形式已经简化为 \((x^1,\dots,x^r,\bar{f}^{r+1}(x^1,\dots,x^r),\dots,\bar{f}^n(x^1,\dots,x^r))\),我们只需构造值域的坐标变换,将后面的 \(n-r\) 个分量消为0。
具体操作:
- 定义值域的映射 \(\bar{v}:V_1\to B\)(\(V_1\) 是 \(\mathbb{R}^n\) 中原点的邻域):
-
验证 \(\bar{v}\) 是局部微分同胚:
- \(\bar{v}(0)=0\):因为 \(\bar{f}^{r+j}(0,\dots,0)=f^{r+j}(u^{-1}(0))=f^{r+j}(0)=0\);
- 计算Jacobi矩阵 \(D\bar{v}(y)\),它是分块下三角矩阵:\[D\bar{v}(y) = \begin{pmatrix} I_r & 0 \\ * & I_{n-r} \end{pmatrix}\]其行列式恒为1,处处非奇异。根据反函数定理,存在原点的邻域 \(V\subset V_1\),使得 \(\bar{v}:V\to \bar{v}(V)=B_0\subset B\) 是 \(C^k\) 微分同胚。
-
复合得到最简形式:
取 \(v=\bar{v}^{-1}\)(也是微分同胚),选取原点的邻域 \(U\subset U_1\) 使得 \(F\circ u^{-1}(U)\subset B_0\),令 \(A_0=u^{-1}(U)\)(\(a=0\) 的邻域)。对任意 \(x=(x^1,\dots,x^m)\in U\),记 \(y=F\circ u^{-1}(x)=(x^1,\dots,x^r,\bar{f}^{r+1}(x^1,\dots,x^r),\dots,\bar{f}^n(x^1,\dots,x^r))\),则 \(v(y)=\bar{v}^{-1}(y)\)。
根据 \(\bar{v}\) 的定义,\(\bar{v}(z)=y\) 等价于:
\[y^1=z^1,\dots,y^r=z^r,\quad y^{r+j}=z^{r+j}+\bar{f}^{r+j}(y^1,\dots,y^r) \]解得 \(z^{r+j}=y^{r+j}-\bar{f}^{r+j}(y^1,\dots,y^r)=0\),因此:
\[v(y) = (z^1,\dots,z^r,z^{r+1},\dots,z^n) = (x^1,\dots,x^r,0,\dots,0) \]即 \(v\circ F\circ u^{-1}(x)=(x^1,\dots,x^r,0,\dots,0)\),完全符合定理的标准形。
综上,四步证明完毕,秩定理成立。
2.4 秩定理的推论
我们可以选取更规整的邻域,让坐标变换更具几何直观:
- 可选取 \(U,V\) 为以原点为中心的开球 \(B_\varepsilon^m(0),B_\varepsilon^n(0)\),或开立方体 \(C_a^m(0),C_a^n(0)\)(\(C_a^s(0)=\{x\in\mathbb{R}^s\mid |x^j|<a,\forall j\}\));
- 记 \(\pi:\mathbb{R}^r\times\mathbb{R}^{n-r}\to\mathbb{R}^r\) 为到前 \(r\) 个坐标的投影,\(i:\mathbb{R}^r\to\mathbb{R}^r\times\{0\}\subset\mathbb{R}^m\) 为单射,则 \(\pi\circ v\circ F\circ u^{-1}\circ i\) 是开球/开立方体上的恒同映射。
三、Sard定理
Sard定理是微分拓扑的核心定理之一,它刻画了光滑映射临界点的“稀缺性”,为横截性理论、Morse理论、流形的嵌入定理等提供了基础。
3.1 临界点与临界值的定义
定义1.1.4 临界点与临界值
设 \(U\) 是 \(\mathbb{R}^m\) 的开子集,\(F:U\to\mathbb{R}^n\) 是 \(C^k\)(\(k\geq1\))映射。
- 对 \(a\in U\),若 \(DF(a)\) 的秩小于 \(n\),则称 \(a\) 是映射 \(F\) 的临界点;
- 若 \(a\) 是临界点,则对应的 \(F(a)\in\mathbb{R}^n\) 称为临界值;
- 不是临界值的点称为正则值(即使它没有原像,也属于正则值)。
3.2 定理内容
定理1.1.7 Sard定理
设 \(F:U\to\mathbb{R}^n\) 是 \(C^k\) 映射,其中光滑性满足 \(k\geq\max\left\{1,\frac{m}{n}\right\}\),\(U\) 是 \(\mathbb{R}^m\) 的开子集。
记 \(A=\{a\in U\mid a\text{ 是 }F\text{ 的临界点}\}\),则临界值的集合 \(F(A)\) 在 \(\mathbb{R}^n\) 中的Lebesgue测度为零。
3.3 定理解读与说明
- 核心意义:Sard定理告诉我们,光滑映射的临界值是“极其稀少”的——在 \(\mathbb{R}^n\) 中测度为零,也就是说,\(\mathbb{R}^n\) 中几乎所有的点都是正则值。
- 光滑性条件:
- 当 \(m\leq n\) 时,\(\max\left\{1,\frac{m}{n}\right\}=1\),即只要 \(F\) 是 \(C^1\) 映射,定理就成立;
- 当 \(m>n\) 时,需要更高的光滑性,例如 \(m=3,n=2\) 时需要 \(k\geq2\),\(m=4,n=2\) 时需要 \(k\geq2\)。若光滑性不满足,存在反例使得Sard定理不成立。
- 经典应用:
- 曲面论中,几乎所有的高度函数都是Morse函数(非退化临界点);
- 流形的嵌入定理:任意 \(m\) 维光滑流形都可以嵌入到 \(\mathbb{R}^{2m+1}\) 中;
- 横截性定理:几乎所有的光滑映射都与给定的子流形横截。
四、核心知识点系统归纳表
| 知识点分类 | 名称 | 核心定义/定理内容 | 关键性质与几何意义 |
|---|---|---|---|
| 基础概念 | 映射的秩 | \(C^k\) 映射 \(F:U\to\mathbb{R}^n\) 在点 \(x\) 的秩,等于其Jacobi矩阵 \(DF(x)\) 的秩 | 映射与微分同胚复合后,秩保持不变,是秩定理的基础 |
| 核心定理 | 秩定理 | 若 \(C^k\) 映射 \(F:A\to B\) 在开集上的秩恒为 \(r\),则存在局部微分同胚 \(u,v\),使得 \(v\circ F\circ u^{-1}\) 化为标准形 \((x^1,\dots,x^r,0,\dots,0)\) | 1. 线性代数秩标准形的非线性推广; 2. 完全刻画了常秩光滑映射的局部结构; 3. 反函数定理是其满秩特例 |
| 基础概念 | 临界点/临界值 | 若 \(DF(a)\) 的秩小于 \(n\),则 \(a\) 是临界点,\(F(a)\) 是临界值 | 临界点是映射失去局部满秩性的点,是映射的“退化点” |
| 核心定理 | Sard定理 | 满足光滑性条件的 \(C^k\) 映射,其临界值集合在 \(\mathbb{R}^n\) 中的Lebesgue测度为零 | 1. 光滑映射的临界值极其稀少,几乎所有点都是正则值; 2. 是微分拓扑、Morse理论、横截性理论的基石 |
最终总结
秩定理与Sard定理是反函数定理的两大核心延伸:
- 秩定理解决了局部结构问题:它告诉我们,只要光滑映射的秩保持常数,无论其非线性形式多复杂,都可以通过光滑坐标变换化为最简的投影形式,将线性代数的结论完美推广到非线性场景,是子流形理论的核心基础。
- Sard定理解决了整体稀缺性问题:它告诉我们,光滑映射的退化点(临界值)在测度意义下可以忽略不计,为我们用“几乎所有”的正则点研究映射的整体性质提供了理论保证,是微分拓扑的核心支柱。
posted on 2026-03-10 13:10 Indian_Mysore 阅读(2) 评论(0) 收藏 举报
浙公网安备 33010602011771号