昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.欧氏空间的映射

欧氏空间的映射与微分 完整讲解与推导

我将以60余年微分几何教学与研究的经验,从基础概念出发,逐层拆解知识点,完成完整的定理证明,最后用表格系统归纳核心内容,帮你搭建起微分几何最核心的“局部线性化”思维框架。


一、前置基础:m维欧氏空间的定义与记号

微分几何的研究载体是欧氏空间,我们先明确最基础的概念与记号规范,这是后续所有内容的基石。

1.1 欧氏空间的定义

\(\mathbb{R}^m\)m个有序实数组的全体,其中的元素(称为)记为:

\[x=(x^1,x^2,\dots,x^m),\quad x^i\in\mathbb{R}\ (i=1,2,\dots,m) \]

关键记号说明:这里的上标 \(i\)坐标指标,不是幂次!这是微分几何的通用记号规范,区分逆变/协变指标,初学者务必注意和幂运算区分。

\(\mathbb{R}^m\) 中任意两点 \(x=(x^1,\dots,x^m)\)\(y=(y^1,\dots,y^m)\),定义欧氏距离

\[d(x,y)=\|x-y\|=\left[\sum_{i=1}^m (x^i-y^i)^2\right]^{1/2} \tag{1.1.1} \]

该距离满足度量空间三公理(非负性、对称性、三角不等式),因此赋予欧氏距离的 \(\mathbb{R}^m\) 成为度量空间,称为m维欧氏空间,常用 \(E^m\) 表示,后续无混淆时不再区分 \(\mathbb{R}^m\)\(E^m\)

1.2 点与向量的等同

坐标全为0的点 \(O=(0,0,\dots,0)\) 称为原点。任意点 \(x\in\mathbb{R}^m\) 都可看作从原点出发的向量,向量的长度就是 \(\|x\|=\|x-O\|\)

这一等同是核心:欧氏空间中的点可以做线性运算(加法、数乘),为后续“微分是线性映射”的定义提供了代数基础。


二、欧氏空间之间的映射:分量表示

我们研究的核心对象,是从m维欧氏空间的开子集到n维欧氏空间的映射,先明确映射的表示方法。

2.1 映射的基本定义

\(U\)\(\mathbb{R}^m\)开子集(开集保证每个点都有邻域包含在 \(U\) 中,可做局部极限运算,是微分局部性的要求),定义映射:

\[F:U\to F(U)\subset\mathbb{R}^n,\quad x\mapsto y=F(x) \]

其中定义域的点 \(x=(x^1,\dots,x^m)\in U\subset\mathbb{R}^m\),像点 \(y=(y^1,\dots,y^n)\in\mathbb{R}^n\)

2.2 投影映射与分量函数

为了把高维映射转化为我们熟悉的多元函数,引入投影映射

\[\pi^\alpha:\mathbb{R}^n\to\mathbb{R},\quad \pi^\alpha(y^1,\dots,y^n)=y^\alpha \quad (\alpha=1,2,\dots,n) \tag{1.1.2} \]

投影映射是线性、连续的,作用是提取 \(\mathbb{R}^n\) 中点的第 \(\alpha\) 个坐标。

借助投影映射,我们可以把映射 \(F\) 拆解为分量函数:对每个 \(\alpha=1,\dots,n\),定义

\[f^\alpha = \pi^\alpha \circ F: U\to\mathbb{R} \]

\(f^\alpha(x)=\pi^\alpha(F(x))\)\(f^\alpha\) 是定义在 \(U\) 上的m元实值函数,称为映射 \(F\)\(\alpha\) 个分量函数

由此,映射 \(F\) 可以完全表示为分量函数的形式:

\[y=F(x)=(f^1(x),f^2(x),\dots,f^n(x)),\quad x\in U \tag{1.1.3} \]

核心结论:欧氏空间之间的映射,与一组多元实值函数一一对应。反过来,任意n个定义在 \(U\) 上的m元函数 \(f^1,\dots,f^n\),都能唯一确定一个映射 \(F:U\to\mathbb{R}^n\)。这一对应把高维映射的研究,完全转化为多元函数的研究。

2.3 经典特例:\(\mathbb{R}^n\) 中的参数曲线

\(m=1\) 时,\(U\)\(\mathbb{R}\) 中的开区间 \((a,b)\),此时映射

\[F:(a,b)\to\mathbb{R}^n,\quad t\mapsto F(t)=(f^1(t),f^2(t),\dots,f^n(t)) \]

就是 \(\mathbb{R}^n\) 中的参数曲线\(t\) 为参数。这是微分几何曲线论的核心研究对象,也是映射的最基础实例。


三、映射的可微性定义

我们已经熟悉一元函数、多元实函数的可微性,现在将其推广到欧氏空间的映射。

3.1 多元实函数可微的回顾

先回顾m元实函数 \(f:U\to\mathbb{R}\)\(U\subset\mathbb{R}^m\) 开集)在点 \(a\in U\) 可微的定义:
存在常数 \(C_1,C_2,\dots,C_m\),使得

\[f(x)=f(a)+\sum_{i=1}^m C_i(x^i-a^i) + \|x-a\| r(x,a) \]

且满足 \(\lim\limits_{x\to a} r(x,a)=0\)
其中常数 \(C_i\) 就是 \(f\)\(a\) 点对 \(x^i\) 的偏导数 \(\frac{\partial f}{\partial x^i}\bigg|_{x=a}\),线性项就是全微分。

3.2 映射可微性的定义

映射的可微性,是逐分量定义的,完全由其分量函数的可微性决定:

定义1.1.1 映射的可微性
\(U\subset\mathbb{R}^m\) 是开集,\(F:U\to\mathbb{R}^n\) 是映射,\(a\in U\)

  1. \(F\) 的每一个分量函数 \(f^1,f^2,\dots,f^n\) 都在点 \(a\) 处可微,则称映射 \(F\) 在点 \(a\) 处可微
  2. 若每个分量函数 \(f^\alpha\)\(a\) 点的所有 \(\leq k\) 阶偏导数都存在且连续,则称 \(F\)\(a\) 点是\(C^k\) 映射(k阶连续可微)
  3. 若每个分量函数都任意阶连续可微(\(C^\infty\)),则称 \(F\)光滑映射
  4. 若每个分量函数都可展开为收敛的幂级数(\(C^\omega\)),则称 \(F\)实解析映射

\(F\) 在开集 \(U\) 的每一点都满足上述性质,则称 \(F\)\(U\) 上可微(\(C^k/C^\infty/C^\omega\))。


四、Jacobi矩阵(雅可比矩阵):微分的矩阵表示

映射的可微性由分量函数的偏导数决定,我们将这些偏导数排成矩阵,就得到了映射的核心工具——Jacobi矩阵,它是映射微分的矩阵表示。

4.1 Jacobi矩阵的定义

\(U\subset\mathbb{R}^m\) 是开集,\(F:U\to\mathbb{R}^n\)\(U\) 上可微,对任意 \(x\in U\),定义n行m列的矩阵:

\[\frac{\partial(f^1,f^2,\dots,f^n)}{\partial(x^1,x^2,\dots,x^m)} = \begin{pmatrix} \frac{\partial f^1}{\partial x^1} & \frac{\partial f^1}{\partial x^2} & \dots & \frac{\partial f^1}{\partial x^m} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial f^n}{\partial x^1} & \frac{\partial f^n}{\partial x^2} & \dots & \frac{\partial f^n}{\partial x^m} \end{pmatrix}\]

该矩阵称为映射 \(F\)\(x\) 点的Jacobi矩阵,简记为 \(DF(x)\)\(F'(x)\)

4.2 核心说明

  1. 维度规则:Jacobi矩阵的行数=像空间维数 \(n\),列数=定义域维数 \(m\),对应 \(\mathbb{R}^m\to\mathbb{R}^n\) 的线性映射;
  2. 元素规则:第 \(\alpha\) 行第 \(i\) 列的元素,是第 \(\alpha\) 个分量函数 \(f^\alpha\) 对第 \(i\) 个坐标 \(x^i\) 的偏导数 \(\frac{\partial f^\alpha}{\partial x^i}\)行对应分量,列对应变量
  3. 光滑性对应:若 \(F\)\(C^k\) 映射,则其Jacobi矩阵的所有元素都是 \(U\) 上的 \(C^{k-1}\) 函数;
  4. 经典特例
    • \(n=1\) 时,\(F\) 是m元实函数,Jacobi矩阵是 \(1\times m\) 行矩阵,即函数的梯度 \(\nabla f\)
    • \(m=n=1\) 时,\(F\) 是一元函数,Jacobi矩阵是 \(1\times1\) 矩阵,元素就是一元函数的导数 \(f'(x)\)
    • \(m=1\) 时,\(F\)\(\mathbb{R}^n\) 中的参数曲线,Jacobi矩阵是 \(n\times1\) 列矩阵,元素就是曲线的切向量 \((\frac{df^1}{dt},\dots,\frac{df^n}{dt})\)

五、核心定理:映射可微的充要条件(完整证明)

这个定理是整个内容的核心,它揭示了微分的本质:用线性映射局部逼近非线性映射,将一元函数可微的核心思想,完整推广到高维映射。

5.1 定理内容

定理1.1.1\(U\)\(\mathbb{R}^m\) 的开子集,映射 \(F:U\to\mathbb{R}^n\),点 \(a\in U\)。则 \(F\) 在点 \(a\) 处可微的充要条件是:
存在一个线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),以及n维向量值函数 \(R(x,a)=(r^1(x,a),r^2(x,a),\dots,r^n(x,a))\),使得

\[F(x) = F(a) + A(x-a) + \|x-a\| R(x,a) \tag{1.1.4} \]

且满足极限条件

\[\lim_{x\to a} \|R(x,a)\| = 0 \tag{1.1.5} \]

5.2 定理的意义

这个式子的本质是:在点 \(a\) 附近,非线性映射 \(F\) 可以分解为三部分:

  • \(F(a)\):常数平移项;
  • \(A(x-a)\):线性映射项,也就是 \(F\)\(a\) 点的微分,是对非线性映射的线性逼近;
  • \(\|x-a\| R(x,a)\):高阶无穷小余项,当 \(x\to a\) 时,余项是比 \(\|x-a\|\) 更高阶的无穷小。

一句话总结:映射在一点可微,等价于它在该点可以被线性映射“完美逼近”,误差为高阶无穷小

5.3 前置引理:向量范数极限与分量极限的等价性

证明前先证明一个核心引理,它是连接向量值极限和分量极限的桥梁:
\(\mathbb{R}^n\) 中的向量值函数 \(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),有

\[\lim_{x\to a} \|R(x,a)\| = 0 \iff \lim_{x\to a} r^\alpha(x,a) = 0,\quad \forall \alpha=1,2,\dots,n \]

引理证明

  1. 必要性(\(\Rightarrow\)):若 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),则对任意 \(\alpha\),有

\[|r^\alpha(x,a)| = \sqrt{(r^\alpha(x,a))^2} \leq \sqrt{\sum_{\beta=1}^n (r^\beta(x,a))^2} = \|R(x,a)\| \]

由夹逼准则,\(\lim\limits_{x\to a} r^\alpha(x,a)=0\)

  1. 充分性(\(\Leftarrow\)):若对所有 \(\alpha\)\(\lim\limits_{x\to a} r^\alpha(x,a)=0\),则

\[\lim_{x\to a} \|R(x,a)\|^2 = \lim_{x\to a} \sum_{\alpha=1}^n (r^\alpha(x,a))^2 = \sum_{\alpha=1}^n \lim_{x\to a} (r^\alpha(x,a))^2 = 0 \]

因此 \(\lim\limits_{x\to a} \|R(x,a)\|=0\)

引理证毕。

5.4 定理的完整证明

我们分必要性充分性两部分完成证明,无任何跳步。


第一部分:必要性(\(\Rightarrow\)):若F在a点可微,则满足定理条件

已知\(F\)\(a\) 点可微,即每个分量函数 \(f^\alpha\) 都在 \(a\) 点可微。

根据多元实函数可微的定义,对每个 \(\alpha=1,\dots,n\),存在常数 \(C_1^\alpha,C_2^\alpha,\dots,C_m^\alpha\),使得

\[f^\alpha(x) = f^\alpha(a) + \sum_{i=1}^m C_i^\alpha (x^i - a^i) + \|x-a\| r^\alpha(x,a) \tag{*} \]

且满足 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\),其中 \(C_i^\alpha = \frac{\partial f^\alpha}{\partial x^i}\bigg|_{x=a}\)(多元函数可微必可偏导,全微分系数为偏导数)。

现在将n个分量的式子(*)整合为向量形式:

  1. 左边:\(F(x)=(f^1(x),f^2(x),\dots,f^n(x))\),常数项 \(F(a)=(f^1(a),\dots,f^n(a))\)
  2. 线性项:将系数 \(C_i^\alpha\) 排成 \(n\times m\) 矩阵 \(A=(A_{\alpha i})\),其中 \(A_{\alpha i}=C_i^\alpha=\frac{\partial f^\alpha}{\partial x^i}\bigg|_{x=a}\)
    对向量 \(h=x-a=(x^1-a^1,\dots,x^m-a^m)\),线性映射 \(A(h)\) 的第 \(\alpha\) 个分量为 \(\sum_{i=1}^m A_{\alpha i} h^i = \sum_{i=1}^m C_i^\alpha (x^i-a^i)\),因此整个线性项为 \(A(x-a)\)
  3. 余项项:将分量余项整合为向量 \(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),则整体余项为 \(\|x-a\| R(x,a)\)

将三部分合并,得到:

\[F(x) = F(a) + A(x-a) + \|x-a\| R(x,a) \]

即式(1.1.4)。

再验证极限条件:由每个 \(f^\alpha\) 可微,得 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\),根据前置引理,直接推出 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),即式(1.1.5)。

必要性证毕。


第二部分:充分性(\(\Leftarrow\)):若满足定理条件,则F在a点可微

已知:存在线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\) 和向量值函数 \(R(x,a)\),使得式(1.1.4)和(1.1.5)成立。

我们需要证明:\(F\) 的每个分量函数 \(f^\alpha\) 都在 \(a\) 点可微,从而 \(F\)\(a\) 点可微。

首先,将式(1.1.4)按分量展开:设线性映射 \(A\) 对应的矩阵为 \((A_{\alpha i})\)\(R(x,a)=(r^1(x,a),\dots,r^n(x,a))\),则式(1.1.4)的第 \(\alpha\) 个分量为:

\[f^\alpha(x) = f^\alpha(a) + \sum_{i=1}^m A_{\alpha i} (x^i - a^i) + \|x-a\| r^\alpha(x,a) \tag{**} \]

由已知条件 \(\lim\limits_{x\to a} \|R(x,a)\|=0\),根据前置引理,对所有 \(\alpha=1,\dots,n\),有 \(\lim\limits_{x\to a} r^\alpha(x,a)=0\)

此时式()完全符合m元实函数可微的定义**:存在常数 \(A_{\alpha 1},\dots,A_{\alpha m}\),使得 \(f^\alpha(x)\) 可表示为常数项+线性项+\(\|x-a\|\) 乘以趋于0的函数,因此每个 \(f^\alpha\) 都在 \(a\) 点可微。

根据映射可微的定义,所有分量函数可微,则映射 \(F\)\(a\) 点可微。

充分性证毕。


综上,必要性与充分性均成立,定理得证。

5.5 核心推论:微分的唯一性

满足定理条件的线性映射 \(A\)唯一的,它就是 \(F\)\(a\) 点的Jacobi矩阵对应的线性映射,称为 \(F\)\(a\) 点的微分,记为 \(dF_a\)\(DF(a)\)

唯一性证明:若存在两个线性映射 \(A_1,A_2\) 都满足定理条件,则两式相减得:

\[(A_1-A_2)(x-a) = \|x-a\| (R_2(x,a)-R_1(x,a)) \]

两边除以 \(\|x-a\|\),令 \(x\to a\),右边趋于0,左边对任意单位向量 \(h\) 都有 \((A_1-A_2)(h)=0\),因此 \(A_1-A_2\) 是零映射,即 \(A_1=A_2\)


六、核心知识点系统归纳表

知识点分类 名称 定义/数学表达式 核心说明与备注
基础空间概念 m维欧氏空间 \(\mathbb{R}^m\)\(E^m\) 全体m元有序实数组的集合,元素 \(x=(x^1,\dots,x^m)\)
欧氏距离 \(d(x,y)=|x-y|=\left[\sum_{i=1}^m (x^i-y^i)^2\right]^{1/2}\)
1. 上标为坐标指标,非幂次;
2. 赋予欧氏距离后成为度量空间;
3. 点与原点出发的向量等同,可做线性运算
映射的表示 欧氏空间的映射 \(F\) \(U\subset\mathbb{R}^m\) 为开集,\(F:U\to\mathbb{R}^n\)\(x\mapsto F(x)\) 定义域为开集,保证局部极限运算可进行,符合微分的局部性
映射的表示 投影映射 \(\pi^\alpha\) \(\pi^\alpha:\mathbb{R}^n\to\mathbb{R}\)\(\pi^\alpha(y^1,\dots,y^n)=y^\alpha\) 线性连续映射,用于将高维映射拆解为分量函数
映射的表示 分量函数 \(f^\alpha\) \(f^\alpha=\pi^\alpha\circ F:U\to\mathbb{R}\),映射可表示为 \(F(x)=(f^1(x),\dots,f^n(x))\) 1. 每个 \(f^\alpha\) 是m元实值函数;
2. 映射与n个分量函数一一对应,将高维问题转化为多元函数问题
映射的表示 特例:\(\mathbb{R}^n\) 中的参数曲线 \(m=1\)\(U=(a,b)\)\(F:(a,b)\to\mathbb{R}^n\)\(t\mapsto F(t)=(f^1(t),\dots,f^n(t))\) 微分几何曲线论的核心研究对象,Jacobi矩阵对应曲线的切向量
可微性定义 映射的可微性 \(F\) 的每个分量函数 \(f^\alpha\) 都在 \(a\in U\) 可微,则称 \(F\)\(a\) 处可微 映射的可微性是逐分量定义的,完全由分量函数的可微性决定
可微性定义 \(C^k\) 映射(k阶连续可微) 每个分量函数的所有 \(\leq k\) 阶偏导数都存在且连续 1. \(C^0\) 为连续映射,\(C^1\) 为一阶连续可微;
2. \(C^k\) 映射的Jacobi矩阵元素为 \(C^{k-1}\) 函数
可微性定义 光滑映射(\(C^\infty\) 映射) 每个分量函数任意阶连续可微 微分几何最常用的映射类,是流形光滑结构的基础
可微性定义 实解析映射(\(C^\omega\) 映射) 每个分量函数可展开为收敛的幂级数 光滑性强于 \(C^\infty\),是性质最好的可微映射
核心矩阵 Jacobi矩阵 \(DF(x)\) \(n\times m\) 矩阵,\(\frac{\partial(f^1,\dots,f^n)}{\partial(x^1,\dots,x^m)}=\left[\frac{\partial f^\alpha}{\partial x^i}\right]_{n\times m}\) 1. 行数=像空间维数n,列数=定义域维数m;
2. 是微分 \(dF_x\) 的矩阵表示;
3. \(n=1\) 时为梯度,\(m=n=1\) 时为一元函数导数
核心定理 映射可微的充要条件 \(F\)\(a\) 可微 \(\iff\) 存在唯一线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),使得:
1. \(F(x)=F(a)+A(x-a)+|x-a|R(x,a)\)
2. \(\lim\limits_{x\to a}|R(x,a)|=0\)
1. 揭示微分的本质:用线性映射局部逼近非线性映射,余项为高阶无穷小;
2. 唯一的线性映射 \(A\) 就是微分 \(dF_a\),矩阵为 \(DF(a)\)
3. 是一元函数可微定义的高维推广,是链规则的理论基础
核心推论 微分的唯一性 满足定理条件的线性映射 \(A\) 唯一,等于Jacobi矩阵对应的线性映射 保证微分的定义是良定的,无歧义

最终总结

这部分内容是微分几何的“微积分基石”,核心完成了两个关键推广:

  1. 把一元/多元实函数,推广到高维欧氏空间之间的映射,通过分量函数实现了高维问题到多元函数问题的转化;
  2. 把一元函数的导数、多元函数的全微分,推广到高维映射的微分——一个线性映射,核心思想是局部线性化,这个思想贯穿了整个微分几何,后续流形的切映射、子流形的嵌入、微分形式的外微分,都是基于这个核心思想展开的。

欧氏空间映射的链规则与光滑截断函数 完整讲解与证明

承接上一节映射可微性的核心结论,我们继续讲解微分的核心运算性质——复合映射的链规则,以及微分几何中至关重要的光滑截断函数定理,这两部分内容是从局部微分性质过渡到整体几何构造的核心基础。


一、微分与Jacobi矩阵的对应关系

上一节我们证明了:映射 \(F:U\to\mathbb{R}^n\) 在点 \(a\in U\) 可微的充要条件是存在唯一的线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\),使得

\[F(x) = F(a) + A(x-a) + \|x-a\| R(x,a),\quad \lim_{x\to a}\|R(x,a)\|=0 \]

现在我们明确这个唯一线性映射的具体形式。

1.1 微分的矩阵表示

对可微映射 \(F\),其分量函数为 \(f^\alpha(x)\ (\alpha=1,\dots,n)\),根据多元函数可微的性质,全微分的系数就是偏导数,即式中线性项的系数

\[C_i^\alpha = \frac{\partial f^\alpha}{\partial x^i}(a),\quad i=1,\dots,m;\ \alpha=1,\dots,n \]

因此线性映射 \(A\) 对应的 \(n\times m\) 矩阵 \((A_{\alpha i})\) 的元素为

\[A_{\alpha i} = \frac{\partial f^\alpha}{\partial x^i}(a) \]

这个矩阵正是 \(F\)\(a\) 点的Jacobi矩阵,记为 \(DF(a)\)

我们将这个唯一的线性映射 \(A:\mathbb{R}^m\to\mathbb{R}^n\) 称为映射 \(F\)\(a\) 点的微分,也用 \(DF(a)\) 表示(矩阵与线性映射一一对应,无混淆时共用记号)。

由此,映射可微的核心表达式可以改写为:

\[F(x) = F(a) + DF(a)(x-a) + \|x-a\| R(x,a) \tag{1.1.4}' \]

核心意义:这个式子是一元函数微分公式 \(f(x)=f(a)+f'(a)(x-a)+o(x-a)\) 在高维映射的完整推广。微分 \(DF(a)\) 就是一元函数导数的高维对应,它是一个线性映射,实现了定义域的切空间到像空间的切空间的线性变换,这是后续流形切映射的核心原型。


二、复合映射的链规则定理(定理1.1.2)

链规则是微分运算的核心性质,它揭示了复合映射的微分等于微分的复合,对应到矩阵就是Jacobi矩阵的乘积。

2.1 复合映射的定义

\(U\subset\mathbb{R}^m\)\(V\subset\mathbb{R}^n\) 为开子集,给定两个映射:

  • \(F:U\to V\)\(x\mapsto y=F(x)\),分量函数为 \(f^1(x),\dots,f^n(x)\)
  • \(G:V\to\mathbb{R}^p\)\(y\mapsto z=G(y)\),分量函数为 \(g^1(y),\dots,g^p(y)\)

则定义复合映射 \(H=G\circ F:U\to\mathbb{R}^p\),满足

\[H(x)=G(F(x)),\quad x\in U \]

其分量函数为多元函数的复合:

\[h^\lambda(x) = g^\lambda\circ F(x) = g^\lambda(f^1(x),f^2(x),\dots,f^n(x)),\quad \lambda=1,2,\dots,p \tag{1.1.6} \]

2.2 链规则定理的内容

定理1.1.2(链规则定理)
若映射 \(F\) 在点 \(a\in U\) 可微,映射 \(G\) 在点 \(b=F(a)\in V\) 可微,则复合映射 \(H=G\circ F\) 在点 \(a\) 可微,且其微分满足

\[DH(a) = DG(F(a)) \cdot DF(a) \tag{1.1.7} \]

\(F\)\(U\) 上、\(G\)\(V\) 上分别可微,则 \(H\)\(U\) 上可微,且式(1.1.7)对任意 \(a\in U\) 成立。

核心解读:

  1. 维度匹配:\(DF(a)\)\(n\times m\) 矩阵,\(DG(b)\)\(p\times n\) 矩阵,二者乘积是 \(p\times m\) 矩阵,恰好是 \(DH(a)\) 的维度(\(H:\mathbb{R}^m\to\mathbb{R}^p\)),完全匹配;
  2. 本质意义:复合映射的微分,就是两个微分的复合(线性映射的复合对应矩阵的乘法),这说明微分运算保持复合结构,是微分几何中“局部线性化”思想的核心体现;
  3. 分量形式:对应到偏导数,就是多元函数复合求导的链规则:\(\frac{\partial h^\lambda}{\partial x^i}(a) = \sum_{\alpha=1}^n \frac{\partial g^\lambda}{\partial y^\alpha}(b) \cdot \frac{\partial f^\alpha}{\partial x^i}(a)\),和矩阵乘法的元素计算完全一致。

2.3 定理的完整证明

我们将证明分为表达式展开余项拆分高阶无穷小验证三个步骤,无任何跳步。

步骤1:利用可微性展开两个映射

\(b=F(a)\)\(y=F(x)\)
\(F\)\(a\) 点可微,得:

\[y - b = F(x) - F(a) = DF(a)(x-a) + \|x-a\| R_F(x,a) \tag{1} \]

其中 \(\lim\limits_{x\to a} \|R_F(x,a)\| = 0\)

\(G\)\(b\) 点可微,得:

\[G(y) - G(b) = DG(b)(y-b) + \|y-b\| R_G(y,b) \tag{2} \]

其中 \(\lim\limits_{y\to b} \|R_G(y,b)\| = 0\)

\(H(x)-H(a)=G(F(x))-G(F(a))=G(y)-G(b)\),将式(1)代入式(2),得:

\[\begin{align*} H(x)-H(a) &= DG(b)\cdot\left[ DF(a)(x-a) + \|x-a\| R_F(x,a) \right] + \|y-b\| R_G(y,b) \\ &= DG(b)\cdot DF(a) (x-a) + \|x-a\| \cdot DG(b) R_F(x,a) + \|y-b\| R_G(y,b) \end{align*} \]

步骤2:整理余项,统一形式

我们将后两项合并为余项,提取公因子 \(\|x-a\|\)

\[H(x)-H(a) = DG(b)\cdot DF(a) (x-a) + \|x-a\| \cdot R_H(x,a) \]

其中余项

\[R_H(x,a) = DG(b) R_F(x,a) + \frac{\|F(x)-F(a)\|}{\|x-a\|} R_G(y,b) \]

根据定理1.1.1,我们只需证明 \(\lim\limits_{x\to a} \|R_H(x,a)\| = 0\),即可证明 \(H\)\(a\) 点可微,且微分 \(DH(a)=DG(b)\cdot DF(a)\)

步骤3:验证余项的极限为0

我们分别估计余项的两部分的范数,利用三角不等式 \(\|A+B\| \leq \|A\| + \|B\|\),只需证明两部分都趋于0即可。

第一部分:\(\| DG(b) R_F(x,a) \|\) 的极限

矩阵的范数满足相容性不等式:对任意矩阵 \(M\) 和向量 \(v\),有 \(\|Mv\| \leq \|M\| \cdot \|v\|\)(这里 \(\|M\|\) 是矩阵的Frobenius范数,即所有元素平方和的平方根,是常数)。

因此:

\[\| DG(b) R_F(x,a) \| \leq \| DG(b) \| \cdot \| R_F(x,a) \| \]

\(F\) 可微,\(\lim\limits_{x\to a} \|R_F(x,a)\|=0\),而 \(\|DG(b)\|\) 是与 \(x\) 无关的常数,因此

\[\lim_{x\to a} \| DG(b) R_F(x,a) \| = 0 \]

第二部分:\(\left\| \frac{\|F(x)-F(a)\|}{\|x-a\|} R_G(y,b) \right\|\) 的极限

首先估计 \(\frac{\|F(x)-F(a)\|}{\|x-a\|}\) 的有界性:
由式(1),根据三角不等式:

\[\|F(x)-F(a)\| = \| DF(a)(x-a) + \|x-a\| R_F(x,a) \| \leq \|DF(a)(x-a)\| + \|x-a\| \cdot \|R_F(x,a)\| \]

两边除以 \(\|x-a\|\),得:

\[\frac{\|F(x)-F(a)\|}{\|x-a\|} \leq \frac{\|DF(a)(x-a)\|}{\|x-a\|} + \|R_F(x,a)\| \]

对线性映射 \(DF(a)\)\(\frac{\|DF(a)(x-a)\|}{\|x-a\|} \leq \|DF(a)\|\)(矩阵范数的定义),因此:

\[\frac{\|F(x)-F(a)\|}{\|x-a\|} \leq \|DF(a)\| + \|R_F(x,a)\| \]

\(x\to a\) 时,\(\|R_F(x,a)\|\to0\),因此这个分式在 \(x\to a\) 时是有界量,极限为 \(\|DF(a)\|\)

再看 \(R_G(y,b)\):当 \(x\to a\) 时,\(F(x)\to F(a)=b\)(可微必连续),即 \(y\to b\),因此由 \(G\) 的可微性,\(\lim\limits_{x\to a} \|R_G(y,b)\| = \lim\limits_{y\to b} \|R_G(y,b)\| = 0\)

因此,有界量乘以无穷小量仍为无穷小量,即:

\[\lim_{x\to a} \left\| \frac{\|F(x)-F(a)\|}{\|x-a\|} R_G(y,b) \right\| = 0 \]

最终余项极限

两部分都趋于0,因此由三角不等式:

\[\lim_{x\to a} \|R_H(x,a)\| \leq \lim_{x\to a} \| DG(b) R_F(x,a) \| + \lim_{x\to a} \left\| \frac{\|F(x)-F(a)\|}{\|x-a\|} R_G(y,b) \right\| = 0 \]

根据定理1.1.1,\(H\)\(a\) 点可微,且微分 \(DH(a)=DG(F(a))\cdot DF(a)\)

定理证毕。

2.4 链规则的推论:\(C^k\) 映射的复合封闭性

推论\(F\)\(U\) 上、\(G\)\(V\) 上都是 \(C^k\) 映射(k阶连续可微),则复合映射 \(H=G\circ F\)\(U\) 上也是 \(C^k\) 映射。

证明(仅证k=1的情况,一般情况用数学归纳法推广)
\(F,G\) 都是 \(C^1\) 映射时,根据定义:

  • \(F\) 的Jacobi矩阵 \(DF\) 的所有元素 \(\frac{\partial f^\alpha}{\partial x^i}\) 都是 \(U\) 上的连续函数;
  • \(G\) 的Jacobi矩阵 \(DG\) 的所有元素 \(\frac{\partial g^\lambda}{\partial y^\alpha}\) 都是 \(V\) 上的连续函数。

根据链规则,\(DH=DG(F(x))\cdot DF(x)\),矩阵乘积的元素是两个矩阵元素的乘积之和,即:

\[\frac{\partial h^\lambda}{\partial x^i}(x) = \sum_{\alpha=1}^n \frac{\partial g^\lambda}{\partial y^\alpha}(F(x)) \cdot \frac{\partial f^\alpha}{\partial x^i}(x) \]

其中:

  • \(\frac{\partial g^\lambda}{\partial y^\alpha}(F(x))\) 是连续函数的复合,仍为连续函数;
  • \(\frac{\partial f^\alpha}{\partial x^i}(x)\) 是连续函数;
  • 有限个连续函数的乘积、和仍为连续函数。

因此 \(DH\) 的所有元素都是 \(U\) 上的连续函数,即 \(H\) 的分量函数的一阶偏导数连续,故 \(H\)\(C^1\) 映射。

对一般的 \(k>1\),可通过数学归纳法:假设 \(k-1\) 时结论成立,对 \(k\) 阶偏导数,其本质是一阶偏导数的 \(k-1\) 阶偏导,因此仍保持连续性,故结论成立。


三、光滑截断函数定理(定理1.1.3)

这个定理是微分几何中局部性质推广到整体性质的核心工具,它保证了我们可以用光滑函数“截断”一个局部定义的函数,将其延拓到整个空间,同时保持光滑性,是单位分解定理的基础。

3.1 定理内容

定理1.1.3\(C\subset\mathbb{R}^n\) 是闭集,\(K\subset\mathbb{R}^n\) 是紧集,且 \(C\cap K=\emptyset\)(二者不相交),则存在一个 \(C^\infty\) 函数 \(\sigma:\mathbb{R}^n\to\mathbb{R}\),满足:

  1. 值域 \(\sigma(\mathbb{R}^n)\subset[0,1]\)
  2. 在紧集 \(K\) 上,\(\sigma(x)\equiv1\)
  3. 在闭集 \(C\) 上,\(\sigma(x)\equiv0\)

3.2 定理的完整证明

证明分为两步:第一步构造局部光滑隆起函数(bump函数),第二步利用紧集的有限覆盖性质构造全局的截断函数。

步骤1:构造局部光滑隆起函数

我们先证明:对任意 \(a\in\mathbb{R}^n\)\(\varepsilon>0\),存在 \(C^\infty\) 函数 \(g:\mathbb{R}^n\to\mathbb{R}\),满足:

  • 在闭球 \(\overline{B_{\varepsilon/2}(a)}\) 上,\(g(x)\equiv1\)
  • 在开球 \(B_\varepsilon(a)\) 上,\(g(x)>0\)
  • 在开球 \(B_\varepsilon(a)\) 的外部,\(g(x)\equiv0\)

其中 \(B_r(a)=\{x\in\mathbb{R}^n\mid \|x-a\|<r\}\) 是以 \(a\) 为中心、\(r\) 为半径的开球,\(\overline{B_r(a)}\) 是对应的闭球。

子步骤1.1:构造一元光滑函数 \(h(t)\)

定义一元函数:

\[h(t) = \begin{cases} 0, & t\leq0 \\ e^{-\frac{1}{t}}, & t>0 \end{cases} \]

我们先证明 \(h(t)\)\(\mathbb{R}\) 上的 \(C^\infty\) 函数:

  • \(t<0\) 时,\(h(t)=0\),任意阶导数都是0,光滑;
  • \(t>0\) 时,\(h(t)=e^{-1/t}\) 是初等函数的复合,任意阶可导,光滑;
  • 关键验证 \(t=0\) 处的光滑性:用数学归纳法可证明,\(h(t)\)\(t=0\) 处的任意阶右导数都为0,即 \(h^{(k)}(0)=0,\ \forall k\in\mathbb{N}\)。因此 \(h(t)\) 在整个 \(\mathbb{R}\) 上任意阶连续可导,是 \(C^\infty\) 函数。
子步骤1.2:构造径向光滑函数 \(\tilde{g}(x)\)

定义函数 \(\tilde{g}:\mathbb{R}^n\to\mathbb{R}\)

\[\tilde{g}(x) = \frac{h(\varepsilon^2 - \|x\|^2)}{h(\varepsilon^2 - \|x\|^2) + h\left(\|x\|^2 - \frac{\varepsilon^2}{4}\right)} \]

我们验证它的性质:

  1. 分母恒不为0:对任意 \(x\in\mathbb{R}^n\)\(\varepsilon^2 - \|x\|^2\)\(\|x\|^2 - \varepsilon^2/4\) 不可能同时≤0:

    • \(\varepsilon^2 - \|x\|^2 \leq0\),则 \(\|x\|^2\geq\varepsilon^2\),此时 \(\|x\|^2 - \varepsilon^2/4 \geq \varepsilon^2 - \varepsilon^2/4 = 3\varepsilon^2/4 >0\),故 \(h\left(\|x\|^2 - \varepsilon^2/4\right)>0\)
    • \(\|x\|^2 - \varepsilon^2/4 \leq0\),则 \(\|x\|^2\leq\varepsilon^2/4\),此时 \(\varepsilon^2 - \|x\|^2 \geq \varepsilon^2 - \varepsilon^2/4 = 3\varepsilon^2/4 >0\),故 \(h(\varepsilon^2 - \|x\|^2)>0\)
      因此分母始终为正,\(\tilde{g}(x)\) 是良定的。
  2. 光滑性\(h(t)\)\(C^\infty\) 函数,\(\|x\|^2\) 是多项式(\(C^\infty\)),因此分子、分母都是 \(C^\infty\) 函数,且分母恒不为0,故 \(\tilde{g}(x)\)\(\mathbb{R}^n\) 上的 \(C^\infty\) 函数。

  3. 取值性质

    • \(\|x\| \leq \varepsilon/2\) 时,\(\|x\|^2 - \varepsilon^2/4 \leq0\),故 \(h\left(\|x\|^2 - \varepsilon^2/4\right)=0\),因此 \(\tilde{g}(x)=\frac{h(\varepsilon^2 - \|x\|^2)}{h(\varepsilon^2 - \|x\|^2)}=1\)
    • \(\|x\| < \varepsilon\) 时,\(\varepsilon^2 - \|x\|^2 >0\),故 \(h(\varepsilon^2 - \|x\|^2)>0\),因此 \(\tilde{g}(x)>0\)
    • \(\|x\| \geq \varepsilon\) 时,\(\varepsilon^2 - \|x\|^2 \leq0\),故 \(h(\varepsilon^2 - \|x\|^2)=0\),因此 \(\tilde{g}(x)=0\)
子步骤1.3:平移得到目标函数

\(g(x)=\tilde{g}(x-a)\),则 \(g(x)\) 就是我们需要的函数:

  • \(\overline{B_{\varepsilon/2}(a)}\) 上,\(g(x)\equiv1\)
  • \(B_\varepsilon(a)\) 上,\(g(x)>0\)
  • \(B_\varepsilon(a)\) 外,\(g(x)\equiv0\)
  • \(g(x)\)\(C^\infty\) 函数。

步骤2:利用有限覆盖构造全局截断函数

已知 \(C\) 是闭集,故 \(\mathbb{R}^n - C\) 是开集;又 \(K\) 是紧集,且 \(K\cap C=\emptyset\),因此 \(K\subset \mathbb{R}^n - C\)

根据紧集的有限覆盖定理:开集 \(\mathbb{R}^n - C\) 覆盖了紧集 \(K\),因此存在有限个开球 \(B_{\varepsilon_i}(a_i)\ (i=1,2,\dots,s)\),满足:

  1. 每个 \(B_{\varepsilon_i}(a_i) \subset \mathbb{R}^n - C\)
  2. 有限个开球覆盖 \(K\),即 \(K\subset \bigcup_{i=1}^s B_{\varepsilon_i/2}(a_i)\)

对每个开球 \(B_{\varepsilon_i}(a_i)\),我们用步骤1构造对应的 \(C^\infty\) 函数 \(g_i(x)\),满足:

  • \(\overline{B_{\varepsilon_i/2}(a_i)}\) 上,\(g_i(x)\equiv1\)
  • \(B_{\varepsilon_i}(a_i)\) 上,\(g_i(x)>0\)
  • \(B_{\varepsilon_i}(a_i)\) 外,\(g_i(x)\equiv0\)

现在定义函数:

\[\sigma(x) = 1 - \prod_{i=1}^s (1 - g_i(x)) \]

我们验证 \(\sigma(x)\) 满足定理的所有条件:

  1. 光滑性:每个 \(g_i(x)\)\(C^\infty\) 函数,因此 \((1-g_i(x))\)\(C^\infty\) 函数,有限个 \(C^\infty\) 函数的乘积、和仍为 \(C^\infty\) 函数,故 \(\sigma(x)\)\(\mathbb{R}^n\) 上的 \(C^\infty\) 函数。

  2. 值域为 \([0,1]\):对任意 \(x\)\(0\leq g_i(x)\leq1\),故 \(0\leq 1-g_i(x)\leq1\),因此 \(0\leq \prod_{i=1}^s (1-g_i(x)) \leq1\),故 \(0\leq \sigma(x)\leq1\)

  3. \(K\)\(\sigma(x)\equiv1\):对任意 \(x\in K\),由覆盖性质,存在某个 \(i\) 使得 \(x\in B_{\varepsilon_i/2}(a_i)\),因此 \(g_i(x)=1\),故 \((1-g_i(x))=0\),因此乘积 \(\prod_{i=1}^s (1-g_i(x))=0\),故 \(\sigma(x)=1-0=1\)

  4. \(C\)\(\sigma(x)\equiv0\):对任意 \(x\in C\)\(x\notin \mathbb{R}^n - C\),因此 \(x\notin B_{\varepsilon_i}(a_i)\) 对所有 \(i\) 成立,故 \(g_i(x)=0\) 对所有 \(i\) 成立,因此 \((1-g_i(x))=1\),乘积 \(\prod_{i=1}^s (1-g_i(x))=1\),故 \(\sigma(x)=1-1=0\)

综上,\(\sigma(x)\) 满足定理的所有要求,定理证毕。

3.3 推论:局部光滑函数的全局延拓

推论\(f(x)\) 是开集 \(U\subset\mathbb{R}^n\) 上的 \(C^k\) 函数,\(a\in U\),则存在 \(a\) 的一个邻域 \(W\subset U\),以及 \(\mathbb{R}^n\) 上的 \(C^k\) 函数 \(f^*:\mathbb{R}^n\to\mathbb{R}\),满足:

  1. 在邻域 \(W\) 上,\(f^*(x)=f(x)\)
  2. \(U\) 的外部,\(f^*(x)\equiv0\)

这个推论的意义是:开集上的局部光滑函数,可以光滑地延拓到整个欧氏空间,且在原定义域外恒为0,这是将局部定义的几何量推广到整体的核心工具。

证明

  1. 选取邻域:因为 \(U\) 是开集,\(a\in U\),因此存在 \(a\) 的两个邻域 \(V_1,V_2\),满足 \(\overline{V_1} \subset V_2 \subset \overline{V_2} \subset U\),且 \(\overline{V_1}\) 是紧集(例如取足够小的开球即可)。

  2. 构造截断函数:令 \(K=\overline{V_1}\)(紧集),\(C=\mathbb{R}^n - V_2\)(闭集),显然 \(K\cap C=\emptyset\),满足定理1.1.3的条件。因此存在 \(C^\infty\) 函数 \(\sigma(x):\mathbb{R}^n\to[0,1]\),满足:

    • \(K=\overline{V_1}\) 上,\(\sigma(x)\equiv1\)
    • \(C=\mathbb{R}^n - V_2\) 上,\(\sigma(x)\equiv0\)
  3. 定义延拓函数:

\[f^*(x) = \begin{cases} \sigma(x) f(x), & x\in U \\ 0, & x\in \mathbb{R}^n - \overline{V_2} \end{cases} \]

  1. 验证良定性与光滑性:

    • 良定性:\((\mathbb{R}^n - \overline{V_2}) \cap U = U - \overline{V_2}\),在这个集合上,\(\sigma(x)\equiv0\),因此 \(\sigma(x)f(x)=0\),和第二部分的定义一致,函数是良定的。
    • 光滑性:
      • 在开集 \(U\) 上,\(\sigma(x)\)\(C^\infty\) 函数,\(f(x)\)\(C^k\) 函数,乘积是 \(C^k\) 函数;
      • 在开集 \(\mathbb{R}^n - \overline{V_2}\) 上,\(f^*(x)\equiv0\),是 \(C^\infty\) 函数;
      • 整个 \(\mathbb{R}^n\) 被这两个开集覆盖,因此 \(f^*(x)\) 在整个 \(\mathbb{R}^n\) 上是 \(C^k\) 函数。
  2. 验证延拓性质:

    • \(W=V_1\),则在 \(W\) 上,\(\sigma(x)\equiv1\),故 \(f^*(x)=1\cdot f(x)=f(x)\)
    • \(U\) 外,\(x\in \mathbb{R}^n - U \subset \mathbb{R}^n - \overline{V_2}\),故 \(f^*(x)\equiv0\)

推论证毕。


四、核心知识点系统归纳表

知识点分类 名称 核心内容 关键性质与几何意义
微分的表示 微分与Jacobi矩阵的对应 可微映射 \(F\)\(a\) 点的微分 \(DF(a)\) 是唯一的线性映射,对应的矩阵是Jacobi矩阵,元素为 \(A_{\alpha i}=\frac{\partial f^\alpha}{\partial x^i}(a)\) 1. 是一元函数导数的高维推广;
2. 实现了定义域到像空间的线性变换,是流形切映射的原型;
3. 可微表达式为 \(F(x)=F(a)+DF(a)(x-a)+o(|x-a|)\)
复合映射 复合映射的定义 \(F:U\to V\subset\mathbb{R}^n\)\(G:V\to\mathbb{R}^p\),复合 \(H=G\circ F:U\to\mathbb{R}^p\),分量为 \(h^\lambda(x)=g^\lambda(f^1(x),\dots,f^n(x))\) 高维映射的复合等价于多元函数的逐分量复合,是微分几何中映射复合的基础形式
核心定理 链规则定理 \(F\)\(a\) 可微,\(G\)\(F(a)\) 可微,则 \(H=G\circ F\)\(a\) 可微,且 \(DH(a)=DG(F(a))\cdot DF(a)\) 1. 复合映射的微分=微分的复合,对应Jacobi矩阵的乘积;
2. 是多元函数复合求导的高维推广,保证微分运算的复合封闭性;
3. 维度匹配:\(p\times m = (p\times n)\cdot(n\times m)\)
核心推论 \(C^k\) 映射的复合封闭性 \(C^k\) 映射的复合仍为 \(C^k\) 映射 1. 一阶连续可微映射的复合,一阶偏导数仍连续;
2. 光滑映射(\(C^\infty\))的复合仍为光滑映射,是光滑流形范畴的核心性质
核心工具 光滑截断函数定理 不相交的紧集 \(K\) 和闭集 \(C\),存在 \(C^\infty\) 函数 \(\sigma:\mathbb{R}^n\to[0,1]\),在 \(K\) 上恒为1,\(C\) 上恒为0 1. 是微分几何局部→整体的核心工具,是单位分解定理的基础;
2. 证明了非平凡光滑隆起函数的存在性,区别于实解析函数(实解析函数无法做到局部恒1、局部恒0)
工具推论 局部光滑函数的全局延拓 开集 \(U\) 上的 \(C^k\) 函数,可延拓为整个 \(\mathbb{R}^n\) 上的 \(C^k\) 函数,且在 \(U\) 外恒为0 解决了局部定义的函数的光滑延拓问题,是将局部几何性质推广到整体流形的关键技术

最终总结

这部分内容完成了微分几何微积分基础的两大核心构建:

  1. 微分的运算性质:通过链规则定理,明确了复合映射的微分运算规则,将一元函数的求导法则完整推广到高维映射,建立了微分运算的代数结构;
  2. 整体化的工具基础:通过光滑截断函数定理,证明了光滑函数的“局部截断-全局延拓”性质,这是微分几何区别于复几何、实解析几何的核心特征——我们可以通过光滑函数灵活地拼接局部构造,实现从局部性质到整体性质的过渡,这也是后续流形上的积分、联络、曲率等整体几何研究的基础。

反函数定理与隐函数定理 完整讲解与证明

我将以微分几何的核心视角,从基础拓扑概念出发,逐层拆解微分同胚的核心定义,完整证明收缩映射引理(不动点定理),再分步骤完成反函数定理的严谨证明,最后推导其推论与隐函数定理,帮你建立起“局部线性可逆→局部微分同胚”的核心逻辑链条。


一、前置基础概念:映射的拓扑与光滑性质

反函数定理的核心是研究映射的局部可逆性,我们先明确从集合映射到光滑映射的层级概念。

1.1 集合映射的基本性质

\(A,B\) 为两个集合,映射 \(F:A\to B\),我们定义三类核心映射性质:

  1. 满射( surjective ):若 \(F(A)=B\),即 \(B\) 中每个元素都有原像,称 \(F\) 为满射;
  2. 单射( injective ):若对任意 \(x_1,x_2\in A\)\(x_1\neq x_2\) 必有 \(F(x_1)\neq F(x_2)\),即不同的点映射到不同的像,称 \(F\) 为单射(一一映射);
  3. 双射( bijective ):若 \(F\) 既是满射又是单射,称 \(F\) 为双射。

核心结论:映射 \(F:A\to B\) 存在逆映射 \(F^{-1}:B\to A\) 的充要条件是 \(F\) 为双射。逆映射满足 \(F\circ F^{-1}=\text{id}_B\)\(F^{-1}\circ F=\text{id}_A\),其中 \(\text{id}\) 为恒等映射。

1.2 同胚:拓扑等价

\(A,B\) 为拓扑空间(此处为欧氏空间的开子集),若 \(F:A\to B\) 是双射,且 \(F\) 和其逆映射 \(F^{-1}\) 都是连续映射,则称 \(F\)同胚(homeomorphism)

同胚是拓扑学的核心等价关系:两个集合同胚,意味着它们在拓扑意义下完全等价,开集、闭集、紧性、连通性等拓扑性质在同胚下完全保持。

1.3 微分同胚:光滑等价

这是微分几何的核心等价关系,在同胚的基础上增加了光滑性要求。

定义1.1.2 \(C^k\)-微分同胚
\(U,V\)\(\mathbb{R}^m\) 中的开集,映射 \(F:U\to V\) 满足:

  1. \(F\) 是同胚(双射+双向连续);
  2. \(F\) 和其逆映射 \(F^{-1}\) 都是 \(C^k\) 映射(\(k\geq1\),即k阶连续可微)。

则称 \(F\)\(C^k\)-微分同胚,称 \(U\)\(V\)\(C^k\)-微分同胚的。当 \(k=\infty\) 时,简称为微分同胚

核心说明

  1. 等价关系:微分同胚是 \(\mathbb{R}^m\) 中开子集之间的等价关系,满足:
    • 反身性:恒等映射 \(\text{id}:U\to U\) 是微分同胚;
    • 对称性:若 \(F:U\to V\) 是微分同胚,则 \(F^{-1}:V\to U\) 也是微分同胚;
    • 传递性:若 \(F:U\to V\)\(G:V\to W\) 都是微分同胚,则复合 \(G\circ F:U\to W\) 也是微分同胚(引理1)。
  2. 几何意义:两个开集微分同胚,意味着它们不仅拓扑等价,而且光滑结构完全一致,后续流形的定义就是基于“局部与欧氏空间微分同胚”这一核心。

1.4 微分同胚的经典例子

例1 平移映射

\(F:\mathbb{R}^m\to\mathbb{R}^m\) 是从点 \(a=(a^1,\dots,a^m)\)\(b=(b^1,\dots,b^m)\) 的平移映射:

\[F(x) = x + (b-a),\quad F(x^1,\dots,x^m)=(x^1+(b^1-a^1),\dots,x^m+(b^m-a^m)) \]

  • 光滑性:分量函数都是一次多项式,是实解析(\(C^\omega\))映射,自然是 \(C^\infty\) 的;
  • 逆映射:\(F^{-1}(x)=x+(a-b)\),同样是平移映射,也是 \(C^\infty\) 的;
  • 同胚性:平移是双射,且双向连续。
    因此平移映射是微分同胚。

例2 可逆线性变换

\(F:\mathbb{R}^m\to\mathbb{R}^m\) 是齐次线性变换:

\[F(x)=A\cdot x,\quad F(x^1,\dots,x^m)=\left( \sum_{j=1}^m a_j^1 x^j, \dots, \sum_{j=1}^m a_j^m x^j \right) \]

其中 \(A=(a_j^i)_{m\times m}\)\(m\) 阶方阵。

  • Jacobi矩阵:直接计算得 \(DF(x)=A\),与 \(x\) 无关;
  • 微分同胚的充要条件:\(F\) 是微分同胚 \(\iff\) \(\det A\neq0\)\(A\) 非奇异/可逆)。
    • 充分性:若 \(\det A\neq0\),则逆矩阵 \(A^{-1}\) 存在,逆映射 \(F^{-1}(x)=A^{-1}\cdot x\) 也是线性变换,\(F\) 是双射,且 \(F,F^{-1}\) 都是 \(C^\infty\) 的,故为微分同胚;
    • 必要性:若 \(\det A=0\),则 \(A\) 是降秩矩阵,存在非零向量 \(x\) 使得 \(F(x)=0\),故 \(F\) 不是单射,不可能是双射,更不是微分同胚。

关键启示:线性变换是微分同胚的充要条件是其微分(Jacobi矩阵)可逆。反函数定理的核心,就是把这个线性映射的结论,推广到非线性映射的局部——只要某点的微分可逆,那么映射在该点的局部就是微分同胚。


二、核心工具:收缩映射定理(不动点定理)

反函数定理的证明依赖于这个泛函分析的核心引理,它保证了方程解的存在性与唯一性。

2.1 定理内容

引理2 收缩映射定理
\(M\) 是完备度量空间,度量为 \(d(x,y)\),映射 \(T:M\to M\)收缩映射:存在常数 \(\lambda\in[0,1)\),使得对任意 \(x,y\in M\),有

\[d(T(x),T(y)) \leq \lambda \cdot d(x,y) \]

\(T\)\(M\) 中存在唯一的不动点 \(a\),即满足 \(T(a)=a\)

2.2 完整证明

证明分为不动点的存在性唯一性两部分。

步骤1:构造柯西列,证明存在性

任取初始点 \(x_0\in M\),定义迭代序列:

\[x_n = T^n(x_0) = T(x_{n-1}),\quad n=1,2,\dots \]

我们先证明 \(\{x_n\}\) 是柯西列。

对任意正整数 \(n,m\),由收缩映射的性质,重复应用不等式得:

\[d(T^n(x),T^n(y)) \leq \lambda^n \cdot d(x,y) \]

因此对 \(x_{n+m}=T^n(x_m)\),有:

\[d(x_n,x_{n+m}) = d(T^n(x_0), T^n(x_m)) \leq \lambda^n \cdot d(x_0,x_m) \]

\(d(x_0,x_m)\) 用三角不等式展开:

\[\begin{align*} d(x_0,x_m) &\leq d(x_0,x_1) + d(x_1,x_2) + \dots + d(x_{m-1},x_m) \\ &\leq d(x_0,x_1) + \lambda d(x_0,x_1) + \dots + \lambda^{m-1} d(x_0,x_1) \\ &= (1+\lambda+\lambda^2+\dots+\lambda^{m-1}) d(x_0,x_1) \\ &\leq \frac{1}{1-\lambda} d(x_0,x_1) \end{align*} \]

这里用到了等比数列求和,且 \(0\leq\lambda<1\),故无穷和收敛。

代入 \(d(x_n,x_{n+m})\) 的估计式,得:

\[d(x_n,x_{n+m}) \leq \lambda^n \cdot \frac{d(x_0,T(x_0))}{1-\lambda} = \lambda^n \cdot K \]

其中 \(K=\frac{d(x_0,T(x_0))}{1-\lambda}\) 是与 \(n,m\) 无关的常数。

由于 \(0\leq\lambda<1\),当 \(n\to\infty\) 时,\(\lambda^n\to0\),因此对任意 \(\varepsilon>0\),存在足够大的 \(N\),当 \(n>N\) 时,\(d(x_n,x_{n+m})<\varepsilon\) 对所有 \(m\) 成立。故 \(\{x_n\}\)柯西列

因为 \(M\) 是完备度量空间,柯西列必收敛,记 \(\lim\limits_{n\to\infty} x_n = a\)

接下来证明 \(a\) 是不动点:由收缩映射的定义,\(T\) 是连续映射(Lipschitz连续必连续),因此

\[T(a) = T\left( \lim_{n\to\infty} x_n \right) = \lim_{n\to\infty} T(x_n) = \lim_{n\to\infty} x_{n+1} = a \]

\(T(a)=a\),不动点存在。

步骤2:证明不动点的唯一性

假设存在两个不同的不动点 \(a,b\),即 \(T(a)=a\)\(T(b)=b\),且 \(a\neq b\),则 \(d(a,b)>0\)

由收缩映射的性质:

\[d(a,b) = d(T(a),T(b)) \leq \lambda \cdot d(a,b) \]

两边除以 \(d(a,b)>0\),得 \(1\leq\lambda\),与 \(\lambda<1\) 的假设矛盾。因此不动点唯一。

定理证毕。


三、核心定理:反函数定理(定理1.1.4)

反函数定理是多元微积分与微分几何的基石,它给出了非线性映射局部可逆的充要条件,建立了“局部线性性质→局部非线性性质”的桥梁。

3.1 定理内容

定理1.1.4 反函数定理
\(U\)\(\mathbb{R}^m\) 的开集,\(F:U\to\mathbb{R}^m\)\(C^k\)\(k\geq1\))映射。若点 \(a\in U\) 处的Jacobi矩阵 \(DF(a)\) 非奇异(即可逆,\(\det DF(a)\neq0\)),则:

  1. 存在 \(a\) 的开邻域 \(W\subset U\),使得 \(F:W\to F(W)=V\)\(C^k\) 微分同胚;
  2. 对任意 \(x\in W\),记 \(y=F(x)\),则逆映射 \(F^{-1}\)\(y\) 处的微分为

\[DF^{-1}(y) = \left( DF(x) \right)^{-1} \tag{1.1.9} \]

其中 \((DF(x))^{-1}\) 是Jacobi矩阵 \(DF(x)\) 的逆矩阵。

3.2 定理的核心解读

  1. 局部性:定理只保证局部微分同胚,即使 \(DF\) 在整个 \(U\) 上处处非奇异,也不能保证 \(F\) 在全局是微分同胚(例如 \(F:\mathbb{R}^2\to\mathbb{R}^2\)\(F(x,y)=(e^x\cos y,e^x\sin y)\)\(DF\) 处处可逆,但不是单射,因为 \(F(x,y+2\pi)=F(x,y)\));
  2. 光滑性保持:原映射是 \(C^k\) 的,逆映射也一定是 \(C^k\) 的,光滑性双向保持;
  3. 微分公式:逆映射的微分是原映射微分的逆,这是一元函数反函数求导公式 \((f^{-1})'(y)=\frac{1}{f'(x)}\) 在高维的完整推广,线性映射的逆对应矩阵的逆。

3.3 定理的完整证明

我们将证明分为6个步骤,每一步都明确动机与逻辑。


步骤1:标准化处理,简化问题

动机:通过平移和可逆线性变换,将一般情况简化为最简洁的标准情形:\(F(0)=0\)\(DF(0)=I\)(单位矩阵),不改变定理的结论。

具体操作:
设原映射 \(F\)\(a\) 点满足 \(F(a)=b\)\(DF(a)=A\)\(A\) 可逆)。我们构造两个微分同胚:

  1. 平移映射 \(\tau_1:\mathbb{R}^m\to\mathbb{R}^m\)\(\tau_1(x)=x+a\),将原点映射到 \(a\)
  2. 可逆线性变换 \(\tau_2:\mathbb{R}^m\to\mathbb{R}^m\)\(\tau_2(y)=A^{-1}(y-b)\),将 \(b\) 映射到原点,且将 \(DF(a)=A\) 变为单位矩阵。

定义复合映射:

\[\tilde{F} = \tau_2 \circ F \circ \tau_1 \]

\(\tilde{F}\) 满足:

  • \(\tilde{F}(0) = \tau_2(F(\tau_1(0))) = \tau_2(F(a)) = \tau_2(b) = 0\)
  • 由链规则,\(D\tilde{F}(0) = A^{-1} \cdot DF(a) \cdot I = A^{-1}A = I\)
  • \(\tilde{F}\) 也是 \(C^k\) 映射,且由微分同胚的传递性,\(F\)\(a\) 附近是局部微分同胚 \(\iff\) \(\tilde{F}\) 在原点附近是局部微分同胚。

因此,我们只需对 \(F(0)=0\)\(DF(0)=I\) 的情形证明定理即可。

现在定义辅助映射:

\[G(x) = x - F(x) \tag{1.1.10} \]

显然有:

  • \(G(0)=0-F(0)=0\)
  • \(DG(x)=I-DF(x)\),故 \(DG(0)=I-DF(0)=0\)(零矩阵)。

步骤2:选取合适的邻域,证明G是压缩映射

动机:我们需要找到一个闭球邻域,使得 \(G\) 是压缩映射,为后续用收缩映射定理做准备,同时得到 \(F\) 的Lipschitz估计。

具体操作:
因为 \(F\)\(C^k\)\(k\geq1\))映射,故 \(DF(x)\)\(DG(x)\) 的所有元素都是 \(x\) 的连续函数。
已知 \(DF(0)=I\)\(\det DF(0)=1\neq0\)),\(DG(0)=0\),由连续性,存在实数 \(r>0\),使得:

  1. 闭球 \(\overline{B_{2r}(0)} \subset U\),且在 \(\overline{B_{2r}(0)}\) 上,\(\det DF(x)\neq0\)\(DF(x)\) 处处非奇异);
  2. 在闭球 \(\overline{B_r(0)}\) 上,\(DG(x)\) 的所有元素的绝对值都不超过 \(\frac{1}{2m}\)\(m\) 是空间维数)。

现在证明:对任意 \(x_1,x_2\in\overline{B_r(0)}\),有

\[\| G(x_1)-G(x_2) \| \leq \frac{1}{2} \|x_1-x_2\| \tag{1.1.11} \]

证明:对 \(G\) 的每个分量函数 \(g^i(x)\),由多元函数的微分中值定理,存在 \(\theta\in(0,1)\),使得

\[g^i(x_1)-g^i(x_2) = \sum_{j=1}^m \frac{\partial g^i}{\partial x^j}\left( x_2+\theta(x_1-x_2) \right) \cdot (x_1^j-x_2^j) \]

由柯西不等式:

\[\begin{align*} |g^i(x_1)-g^i(x_2)| &\leq \sqrt{\sum_{j=1}^m \left( \frac{\partial g^i}{\partial x^j} \right)^2} \cdot \sqrt{\sum_{j=1}^m (x_1^j-x_2^j)^2} \\ &\leq \sqrt{m \cdot \left( \frac{1}{2m} \right)^2} \cdot \|x_1-x_2\| \\ &= \frac{\sqrt{m}}{2m} \|x_1-x_2\| \end{align*} \]

因此,\(G\) 的范数满足:

\[\begin{align*} \|G(x_1)-G(x_2)\| &= \sqrt{\sum_{i=1}^m (g^i(x_1)-g^i(x_2))^2} \\ &\leq \sqrt{m \cdot \left( \frac{\sqrt{m}}{2m} \|x_1-x_2\| \right)^2} \\ &= \sqrt{m \cdot \frac{m}{4m^2} \|x_1-x_2\|^2} \\ &= \frac{1}{2} \|x_1-x_2\| \end{align*} \]

式(1.1.11)得证,即 \(G\)\(\overline{B_r(0)}\) 上是压缩系数为 \(\frac{1}{2}\) 的压缩映射。

接下来推导 \(F\) 的Lipschitz下界估计:
\(G(x)=x-F(x)\),得 \(F(x)=x-G(x)\),因此

\[F(x_1)-F(x_2) = (x_1-x_2) - (G(x_1)-G(x_2)) \]

由三角不等式 \(\|a-b\| \geq |\|a\|-\|b\||\),得:

\[\|F(x_1)-F(x_2)\| \geq \|x_1-x_2\| - \|G(x_1)-G(x_2)\| \geq \|x_1-x_2\| - \frac{1}{2}\|x_1-x_2\| = \frac{1}{2}\|x_1-x_2\| \]

整理得:

\[\|x_1-x_2\| \leq 2 \|F(x_1)-F(x_2)\| \tag{1.1.12} \]

这个不等式说明 \(F\)\(\overline{B_r(0)}\) 上是单射(若 \(F(x_1)=F(x_2)\),则 \(x_1=x_2\))。


步骤3:用收缩映射定理证明局部逆映射的存在性与唯一性

动机:对每个目标点 \(y\),我们将方程 \(F(x)=y\) 转化为不动点问题,用收缩映射定理证明解的存在唯一性。

具体操作:
首先证明:对任意 \(x\in\overline{B_r(0)}\),有 \(\|G(x)\| \leq \frac{r}{2}\)
在式(1.1.11)中令 \(x_1=x\)\(x_2=0\),得:

\[\|G(x)-G(0)\| \leq \frac{1}{2}\|x-0\| \]

\(G(0)=0\),故 \(\|G(x)\| \leq \frac{1}{2}\|x\|\)。当 \(\|x\|\leq r\) 时,\(\|G(x)\| \leq \frac{r}{2}\),即 \(G(\overline{B_r(0)}) \subset \overline{B_{\frac{r}{2}}(0)}\)

现在,对任意固定的 \(y\in\overline{B_{\frac{r}{2}}(0)}\),定义映射:

\[T_y: \overline{B_r(0)} \to \overline{B_r(0)},\quad T_y(x) = y + G(x) \]

首先验证 \(T_y\) 确实将 \(\overline{B_r(0)}\) 映射到自身:对任意 \(x\in\overline{B_r(0)}\)

\[\|T_y(x)\| = \|y+G(x)\| \leq \|y\| + \|G(x)\| \leq \frac{r}{2} + \frac{r}{2} = r \]

\(T_y(x)\in\overline{B_r(0)}\)

再验证 \(T_y\) 是压缩映射:对任意 \(x_1,x_2\in\overline{B_r(0)}\)

\[\|T_y(x_1)-T_y(x_2)\| = \|G(x_1)-G(x_2)\| \leq \frac{1}{2}\|x_1-x_2\| \]

压缩系数 \(\lambda=\frac{1}{2}<1\),满足收缩映射定理的条件。

\(\overline{B_r(0)}\) 是完备度量空间(欧氏空间的闭子集是完备的),因此由收缩映射定理,\(T_y\)\(\overline{B_r(0)}\) 中存在唯一的不动点 \(x\),即

\[T_y(x)=x \iff y + G(x) = x \iff y = x-G(x) = F(x) \]

这说明:对每个 \(y\in\overline{B_{\frac{r}{2}}(0)}\),存在唯一的 \(x\in\overline{B_r(0)}\) 使得 \(F(x)=y\)。由此我们得到了逆映射:

\[F^{-1}: \overline{B_{\frac{r}{2}}(0)} \to \overline{B_r(0)},\quad F^{-1}(y)=x \]

满足 \(F\circ F^{-1}(y)=y\) 对所有 \(y\in\overline{B_{\frac{r}{2}}(0)}\) 成立。


步骤4:证明F是局部同胚

动机:我们已经得到了逆映射,现在需要证明 \(F\) 是同胚,即 \(F\) 是开映射,且逆映射连续。

具体操作:
\(W=F^{-1}(B_{\frac{r}{2}}(0))\)\(V=B_{\frac{r}{2}}(0)\)(开球)。

  1. \(W\) 是开集:因为 \(F\) 是连续映射,开集的原像是开集,\(V=B_{\frac{r}{2}}(0)\) 是开集,故 \(W=F^{-1}(V)\) 是开集,且 \(W\subset\overline{B_r(0)}\subset U\),即 \(W\)\(a=0\) 的开邻域。
  2. \(F:W\to V\) 是双射:由步骤3,对每个 \(y\in V\),存在唯一的 \(x\in W\) 使得 \(F(x)=y\),故 \(F\) 是双射。
  3. 逆映射 \(F^{-1}:V\to W\) 连续:对任意 \(y_1,y_2\in V\),记 \(x_1=F^{-1}(y_1)\)\(x_2=F^{-1}(y_2)\),由式(1.1.12)的Lipschitz估计:

\[\|F^{-1}(y_1)-F^{-1}(y_2)\| = \|x_1-x_2\| \leq 2\|F(x_1)-F(x_2)\| = 2\|y_1-y_2\| \]

这说明 \(F^{-1}\) 是Lipschitz连续的,自然是连续映射。

综上,\(F:W\to V\) 是双射+双向连续,即同胚


步骤5:证明逆映射的可微性与微分公式

动机:我们已经证明了 \(F\) 是同胚,现在需要证明逆映射 \(F^{-1}\) 是可微的,且满足微分公式(1.1.9)。

具体操作:
任取 \(b=F(a)\in V\),我们证明 \(F^{-1}\)\(b\) 点可微,且 \(DF^{-1}(b)=(DF(a))^{-1}\)

因为 \(F\)\(a\) 点可微,由可微的定义,有:

\[F(x)-F(a) = DF(a)(x-a) + \|x-a\| R(x,a) \tag{*} \]

其中 \(\lim\limits_{x\to a} \|R(x,a)\|=0\)

\(y=F(x)\)\(b=F(a)\),则 \(x=F^{-1}(y)\)\(a=F^{-1}(b)\)。因为 \(DF(a)\) 可逆,记 \(B=(DF(a))^{-1}\),用 \(B\) 左乘式(*)两边,得:

\[B(y-b) = x-a + \|x-a\| B R(x,a) \]

\(x=F^{-1}(y)\)\(a=F^{-1}(b)\) 代入,整理得:

\[F^{-1}(y) = F^{-1}(b) + B(y-b) - \|F^{-1}(y)-F^{-1}(b)\| B R(F^{-1}(y),F^{-1}(b)) \]

这正是逆映射可微的定义形式,我们只需证明余项是高阶无穷小。令余项:

\[r(y,b) = -\frac{\|F^{-1}(y)-F^{-1}(b)\|}{\|y-b\|} B R(F^{-1}(y),F^{-1}(b)),\quad y\neq b \]

我们验证 \(\lim\limits_{y\to b} \|r(y,b)\|=0\)

  1. 由式(1.1.12),\(\frac{\|F^{-1}(y)-F^{-1}(b)\|}{\|y-b\|} \leq 2\),是有界量;
  2. \(B\) 是常数矩阵,\(\|B\|\) 是常数;
  3. \(y\to b\) 时,\(F^{-1}\) 连续,故 \(x=F^{-1}(y)\to a=F^{-1}(b)\),因此 \(\lim\limits_{y\to b} \|R(F^{-1}(y),F^{-1}(b))\| = \lim\limits_{x\to a} \|R(x,a)\|=0\)

有界量乘以无穷小量仍为无穷小量,故 \(\lim\limits_{y\to b} \|r(y,b)\|=0\)

根据映射可微的充要条件(定理1.1.1),\(F^{-1}\)\(b\) 点可微,且微分就是线性映射 \(B=(DF(a))^{-1}\),即

\[DF^{-1}(b) = (DF(a))^{-1} \]

微分公式得证。


步骤6:证明逆映射是 \(C^k\)

动机:我们已经证明了逆映射是 \(C^1\) 的,现在需要证明它和原映射有相同的光滑性,即原映射是 \(C^k\) 的,逆映射也是 \(C^k\) 的。

具体操作:
我们用数学归纳法证明:

  1. 基例 \(k=1\):原映射 \(F\)\(C^1\) 的,即 \(DF(x)\) 的元素都是连续函数。
    由微分公式,\(DF^{-1}(y) = (DF(F^{-1}(y)))^{-1}\)
    逆矩阵的元素是原矩阵元素的有理函数(伴随矩阵除以行列式),是 \(C^\infty\) 函数;\(DF\) 的元素是连续的,\(F^{-1}\) 是连续的,因此复合后 \(DF^{-1}(y)\) 的元素都是连续函数,故 \(F^{-1}\)\(C^1\) 的。

  2. 归纳步骤:假设当原映射是 \(C^l\)\(l<k\))时,逆映射也是 \(C^l\) 的。
    若原映射 \(F\)\(C^{l+1}\) 的,则 \(DF(x)\) 的元素是 \(C^l\) 的。由归纳假设,\(F^{-1}\)\(C^l\) 的,因此 \(DF^{-1}(y)=(DF(F^{-1}(y)))^{-1}\) 的元素是 \(C^l\) 函数的复合,也是 \(C^l\) 的,故 \(F^{-1}\)\(C^{l+1}\) 的。

由数学归纳法,对任意 \(k\geq1\),若 \(F\)\(C^k\) 的,则 \(F^{-1}\) 也是 \(C^k\) 的。


综上,我们证明了 \(F:W\to V\)\(C^k\) 微分同胚,且逆映射的微分公式成立,定理证毕。


四、反函数定理的推论与隐函数定理

4.1 反函数定理的两个核心推论

推论1 开映射性质

\(DF\) 在开集 \(U\) 上处处非奇异,则 \(F\)开映射:它将 \(U\) 中的任意开集都映射为 \(\mathbb{R}^m\) 中的开集。

证明:对任意开集 \(U'\subset U\),任取 \(y\in F(U')\),则存在 \(x\in U'\) 使得 \(F(x)=y\)。由反函数定理,存在 \(x\) 的开邻域 \(W\subset U'\),使得 \(F(W)\) 是开集,且 \(y\in F(W)\subset F(U')\)。因此 \(y\)\(F(U')\) 的内点,由 \(y\) 的任意性,\(F(U')\) 是开集。

推论2 全局微分同胚的充要条件

\(C^k\) 映射 \(F:U\to F(U)\)\(C^k\) 微分同胚的充要条件是:\(F\) 是单射,且 \(DF\)\(U\) 的每一点都非奇异。

证明

  • 必要性:若 \(F\) 是微分同胚,则 \(F\) 是单射,且对任意 \(x\in U\)\(DF(x)\) 可逆(否则逆映射的微分不存在),故 \(DF\) 处处非奇异。
  • 充分性:若 \(F\) 是单射,且 \(DF\) 处处非奇异,则由反函数定理,\(F\) 是局部微分同胚,逆映射局部光滑;又 \(F\) 是单射,故全局逆映射存在,且局部光滑意味着全局光滑,因此 \(F\) 是全局微分同胚。

4.2 隐函数定理

隐函数定理是反函数定理的直接推论,它解决了“方程 \(f(x,y)=0\) 何时能确定 \(y\)\(x\) 的函数”这一核心问题,是微分几何中曲面、子流形定义的基础。

定理内容

定理1.1.5 隐函数定理
\(U\subset\mathbb{R}^m\)\(V\subset\mathbb{R}^n\) 是开集,映射 \(f:U\times V\to\mathbb{R}^n\)\(C^k\)\(k\geq1\))映射。若对 \(x_0\in U\)\(y_0\in V\),满足:

  1. \(f(x_0,y_0)=0\)
  2. 映射 \(y\mapsto f(x_0,y)\)\(y_0\) 处的微分 \(D_2 f(x_0,y_0)\) 非奇异(即可逆,\(\det D_2 f(x_0,y_0)\neq0\),其中 \(D_2 f\)\(f\) 对第二个变量 \(y\) 的Jacobi矩阵)。

则存在 \(x_0\) 的开邻域 \(U_0\subset U\),以及唯一的 \(C^k\) 映射 \(g:U_0\to V\),满足:

  1. \(g(x_0)=y_0\)
  2. 对所有 \(x\in U_0\),有 \(f(x,g(x))=f(x_0,y_0)=0\)

完整证明

核心思路:构造一个辅助映射,将隐函数问题转化为反函数定理的适用场景。

具体操作:
构造辅助映射 \(F:U\times V\to\mathbb{R}^m\times\mathbb{R}^n\)

\[F(x,y) = (x, f(x,y)) \]

我们计算 \(F\)\((x_0,y_0)\) 处的Jacobi矩阵:

\[DF(x_0,y_0) = \begin{pmatrix} I_m & 0 \\ D_1 f(x_0,y_0) & D_2 f(x_0,y_0) \end{pmatrix}\]

其中 \(I_m\)\(m\) 阶单位矩阵,\(D_1 f\)\(f\) 对第一个变量 \(x\) 的Jacobi矩阵。

这是分块上三角矩阵,其行列式等于对角块行列式的乘积:

\[\det DF(x_0,y_0) = \det I_m \cdot \det D_2 f(x_0,y_0) = \det D_2 f(x_0,y_0) \neq 0 \]

因此 \(DF(x_0,y_0)\) 非奇异,满足反函数定理的条件。

由反函数定理,存在 \((x_0,y_0)\) 的开邻域 \(U_0\times V_0\subset U\times V\),使得 \(F:U_0\times V_0\to F(U_0\times V_0)\)\(C^k\) 微分同胚,其逆映射 \(F^{-1}\) 也是 \(C^k\) 的。

注意到 \(F(x_0,y_0)=(x_0,f(x_0,y_0))=(x_0,0)\),因此逆映射 \(F^{-1}\) 定义在 \((x_0,0)\) 的开邻域上,形式为:

\[F^{-1}(x,z) = (x, \varphi(x,z)) \]

其中 \(\varphi\)\(C^k\) 映射,满足 \(F(x,\varphi(x,z))=(x,z)\),即 \(f(x,\varphi(x,z))=z\)

现在定义映射 \(g:U_0\to V\)

\[g(x) = \varphi(x,0) \]

\(g\)\(C^k\) 映射,且:

  1. \(g(x_0)=\varphi(x_0,0)=y_0\),因为 \(F^{-1}(x_0,0)=(x_0,y_0)\)
  2. 对所有 \(x\in U_0\)\(f(x,g(x))=f(x,\varphi(x,0))=0\),满足方程。

唯一性:若存在另一个映射 \(\tilde{g}\) 满足条件,则对任意 \(x\in U_0\)\(F(x,g(x))=(x,0)=F(x,\tilde{g}(x))\),而 \(F\) 是单射,故 \(g(x)=\tilde{g}(x)\),唯一性得证。

定理证毕。


五、核心知识点系统归纳表

知识点分类 名称 核心定义/定理内容 关键性质与几何意义
基础映射概念 单射/满射/双射 单射:不同点映射到不同像;满射:像覆盖整个目标集;双射:单射+满射 双射是逆映射存在的充要条件,是可逆性的集合论基础
基础映射概念 同胚 双射+双向连续的映射 拓扑等价关系,保持所有拓扑性质(开集、紧性、连通性等)
基础映射概念 \(C^k\)-微分同胚 同胚+双向\(C^k\)(k阶连续可微)的映射 微分几何的核心等价关系,光滑流形的定义基础,保持拓扑与光滑结构
核心工具 收缩映射定理 完备度量空间上的压缩映射(压缩系数λ<1)存在唯一不动点 证明方程解的存在唯一性的核心工具,是反函数定理证明的基石
核心定理 反函数定理 \(C^k\)映射\(F:U\to\mathbb{R}^m\),若\(a\)\(DF(a)\)非奇异,则存在\(a\)的开邻域\(W\),使得\(F:W\to F(W)\)\(C^k\)微分同胚,且\(DF^{-1}(y)=(DF(x))^{-1}\) 1. 核心结论:局部线性可逆→局部微分同胚
2. 是一元反函数求导的高维推广;
3. 仅保证局部可逆,不保证全局可逆
反函数定理推论 开映射定理 \(DF\)在开集\(U\)上处处非奇异,则\(F\)是开映射 说明局部可逆的映射将开集映射为开集,是拓扑性质的重要结论
核心定理 隐函数定理 \(C^k\)映射\(f:U\times V\to\mathbb{R}^n\),若\(f(x_0,y_0)=0\)\(D_2f(x_0,y_0)\)非奇异,则局部存在唯一\(C^k\)映射\(g\)使得\(f(x,g(x))=0\)\(g(x_0)=y_0\) 1. 是反函数定理的直接推论;
2. 解决了方程确定隐函数的问题;
3. 是欧氏空间中子流形、曲面定义的核心理论基础

最终总结

反函数定理与隐函数定理是连接线性代数与非线性分析的桥梁,是微分几何的“微积分基石”。它们的核心思想可以概括为一句话:只要一个光滑映射在某点的微分(线性近似)是可逆的,那么这个映射在该点的局部就是可逆的微分同胚,其局部行为完全由线性近似决定

这一思想贯穿了整个微分几何:从欧氏空间的子流形,到抽象光滑流形的切映射、坐标变换,再到黎曼几何的局部坐标系构造,无一不是基于反函数定理提供的局部可逆性保证。


秩定理与Sard定理 完整讲解与证明

承接反函数定理的核心思想,我们继续讲解微分几何中两个核心的基础定理:秩定理Sard定理。秩定理是反函数定理的重要推广,它刻画了常秩光滑映射的局部标准形,将线性代数的秩标准形推广到非线性场景;Sard定理则揭示了光滑映射临界点的测度性质,是微分拓扑的基石之一。


一、映射的秩的核心定义

我们首先明确映射的秩的概念,它是整个章节的基础。

定义1.1.3 映射的秩
\(U\)\(\mathbb{R}^m\) 的开子集,\(F:U\to\mathbb{R}^n\)\(C^k\)\(k\geq1\))映射。

  1. 映射 \(F\) 在点 \(x\in U\) 的秩,定义为其Jacobi矩阵 \(DF(x)\)\(x\) 点的秩;
  2. 若对开子集 \(W\subset U\) 中的每一个点 \(x\)\(F\) 的秩恒为常数 \(r\),则称 \(F\)\(W\) 上的秩等于 \(r\)

关键性质:秩在微分同胚复合下不变

若映射 \(F\) 与微分同胚做复合,则复合映射的秩与原映射的秩完全相等。
证明:设 \(u\) 是微分同胚,由链规则,复合映射 \(F\circ u^{-1}\) 的Jacobi矩阵为

\[D(F\circ u^{-1})(x) = DF(u^{-1}(x)) \cdot Du^{-1}(x) \]

微分同胚的Jacobi矩阵处处非奇异(可逆),而矩阵与可逆矩阵相乘不改变秩,因此 \(D(F\circ u^{-1})(x)\) 的秩与 \(DF(u^{-1}(x))\) 的秩相等。

这一性质是秩定理的核心基础:我们可以通过定义域和值域的微分同胚(坐标变换),将复杂的常秩映射化简为最简标准形。


二、秩定理(定理1.1.6)

秩定理是反函数定理的一般化:反函数定理处理的是满秩\(r=m=n\))的情况,而秩定理处理任意常秩的情况,是线性代数中“秩标准形”的非线性推广。

2.1 定理内容

定理1.1.6 秩定理
\(A,B\) 分别为 \(\mathbb{R}^m,\mathbb{R}^n\) 中的开子集,\(F:A\to B\)\(C^k\)\(k\geq1\))映射,且 \(F\)\(A\) 上的秩恒为常数 \(r\)
对任意 \(a\in A\),记 \(b=F(a)\in B\),则存在:

  1. \(a\) 的开邻域 \(A_0\subset A\)\(b\) 的开邻域 \(B_0\subset B\)
  2. \(C^k\) 微分同胚 \(u:A_0\to U\subset\mathbb{R}^m\)\(v:B_0\to V\subset\mathbb{R}^n\)

使得复合映射 \(v\circ F\circ u^{-1}:U\to V\) 具有最简标准形:

\[v\circ F\circ u^{-1}(x^1,x^2,\dots,x^m) = (x^1,x^2,\dots,x^r,\underbrace{0,\dots,0}_{n-r\text{个}}) \tag{1.1.14} \]

2.2 定理的核心解读

  1. 线性代数的非线性推广:线性变换 \(T:\mathbb{R}^m\to\mathbb{R}^n\) 秩为 \(r\) 时,存在可逆矩阵 \(P,Q\) 使得 \(PTQ=\begin{pmatrix}I_r & 0 \\ 0 & 0\end{pmatrix}\)(秩标准形)。秩定理中,微分同胚 \(u\) 对应坐标变换 \(Q\)\(v\) 对应坐标变换 \(P\),将非线性的常秩映射局部化为线性的投影形式。
  2. 局部结构完全确定:常秩映射的局部行为完全由其秩决定,无论非线性项多复杂,都可以通过光滑坐标变换变成“前r个坐标保留,后n-r个坐标置零”的最简形式。
  3. 反函数定理是特例:当 \(r=m=n\) 时,标准形为 \(v\circ F\circ u^{-1}(x)=x\),即 \(F=v^{-1}\circ u\),是两个微分同胚的复合,本身也是局部微分同胚,与反函数定理的结论完全一致。

2.3 定理的完整证明

我们将证明分为4个核心步骤,每一步都明确动机与逻辑,无跳步。


步骤1:标准化处理,简化问题

动机:通过平移和坐标置换,将问题简化为最规整的情形:\(a,b\) 均为原点,且 \(DF(a)\) 的左上角 \(r\) 阶子式非奇异,不改变定理的结论。

具体操作:

  1. 平移坐标:令 \(x'=x-a\)\(y'=y-b\),则新的映射 \(F'(x')=F(x'+a)-b\) 满足 \(F'(0)=0\),且 \(DF'(0)=DF(a)\),秩仍为 \(r\),将 \(a,b\) 化为原点。
  2. 坐标置换:由于 \(DF(0)\) 的秩为 \(r\),必存在一个非零的 \(r\) 阶子式。通过置换坐标(置换坐标是微分同胚,不改变映射的秩),可让左上角的 \(r\) 阶子式非奇异,即:

\[\det\begin{pmatrix} \frac{\partial f^1}{\partial x^1}(0) & \dots & \frac{\partial f^1}{\partial x^r}(0) \\ \vdots & \ddots & \vdots \\ \frac{\partial f^r}{\partial x^1}(0) & \dots & \frac{\partial f^r}{\partial x^r}(0) \end{pmatrix} \neq 0\]


步骤2:构造定义域的微分同胚 \(u\),“拉直”前r个分量

动机:我们希望将 \(F\) 的前 \(r\) 个分量转化为新的坐标,让前 \(r\) 个分量完全简化为坐标本身,为后续化简做准备。

具体操作:
定义 \(C^k\) 映射 \(u:A\to\mathbb{R}^m\)

\[u(x^1,x^2,\dots,x^m) = \left(f^1(x),f^2(x),\dots,f^r(x),x^{r+1},\dots,x^m\right) \]

我们验证 \(u\) 是局部微分同胚:

  1. \(u(0)=0\):因为 \(F(0)=0\),故 \(f^1(0)=\dots=f^r(0)=0\)
  2. 计算 \(u\) 的Jacobi矩阵 \(Du(x)\),它是分块矩阵:

\[Du(x) = \begin{pmatrix} \underbrace{\begin{pmatrix}\frac{\partial f^1}{\partial x^1} & \dots & \frac{\partial f^1}{\partial x^r} \\ \vdots & \ddots & \vdots \\ \frac{\partial f^r}{\partial x^1} & \dots & \frac{\partial f^r}{\partial x^r}\end{pmatrix}}_{r\times r} & \underbrace{*}_{r\times(m-r)} \\ \underbrace{0}_{(m-r)\times r} & \underbrace{I_{m-r}}_{(m-r)\times(m-r)} \end{pmatrix}\]

其中 \(I_{m-r}\)\((m-r)\) 阶单位矩阵,左下角为零矩阵。

分块三角矩阵的行列式等于对角块行列式的乘积,因此 \(\det Du(x) = \det\left(\frac{\partial f^\alpha}{\partial x^i}\right)_{\alpha,i=1}^r\)。由步骤1,在 \(x=0\) 处该行列式非零,故 \(Du(0)\) 非奇异。

根据反函数定理,存在原点的开邻域 \(A_1\subset A\),使得 \(u:A_1\to u(A_1)=U_1\)\(C^k\) 微分同胚。


步骤3:化简复合映射,证明后段分量仅依赖前r个坐标

动机:我们已经得到了定义域的坐标变换 \(u\),现在分析复合映射 \(F\circ u^{-1}\) 的形式,证明其后面的分量仅与前 \(r\) 个坐标有关,与后 \(m-r\) 个坐标无关。

具体操作:
\(u^{-1}(x^1,\dots,x^m)=z\),即 \(u(z)=(f^1(z),\dots,f^r(z),z^{r+1},\dots,z^m)=(x^1,\dots,x^m)\),因此 \(F(z)=(f^1(z),\dots,f^r(z),f^{r+1}(z),\dots,f^n(z))\)

代入 \(z=u^{-1}(x)\),得复合映射:

\[F\circ u^{-1}(x) = \left(x^1,x^2,\dots,x^r,\bar{f}^{r+1}(x),\dots,\bar{f}^n(x)\right) \]

其中 \(\bar{f}^{r+j}(x) = f^{r+j}(u^{-1}(x))\)\(j=1,2,\dots,n-r\)

接下来证明:\(\bar{f}^{r+j}(x)\) 仅依赖前 \(r\) 个坐标 \(x^1,\dots,x^r\),与 \(x^{r+1},\dots,x^m\) 无关。

计算 \(F\circ u^{-1}\) 的Jacobi矩阵,它是分块矩阵:

\[D(F\circ u^{-1})(x) = \begin{pmatrix} \underbrace{I_r}_{r\times r} & \underbrace{0}_{r\times(m-r)} \\ \underbrace{*}_{(n-r)\times r} & \underbrace{\left(\frac{\partial \bar{f}^{r+j}}{\partial x^{r+i}}\right)}_{(n-r)\times(m-r)} \end{pmatrix}\]

由于 \(u\) 是微分同胚,\(F\circ u^{-1}\) 的秩与 \(F\) 的秩相等,恒为 \(r\)。而该矩阵的前 \(r\) 行已经是线性无关的(包含单位矩阵 \(I_r\)),因此整个矩阵的秩为 \(r\) 的充要条件是:右下角的 \((n-r)\times(m-r)\) 矩阵的所有元素全为0,即

\[\frac{\partial \bar{f}^{r+j}}{\partial x^{r+i}}(x) = 0,\quad \forall i=1,\dots,m-r,\ j=1,\dots,n-r,\ x\in U_1 \]

偏导数恒为0,说明 \(\bar{f}^{r+j}(x)\) 不依赖 \(x^{r+1},\dots,x^m\),仅与 \(x^1,\dots,x^r\) 有关,即

\[\bar{f}^{r+j}(x) = \bar{f}^{r+j}(x^1,\dots,x^r) \]


步骤4:构造值域的微分同胚 \(v\),得到最简标准形

动机:现在 \(F\circ u^{-1}\) 的形式已经简化为 \((x^1,\dots,x^r,\bar{f}^{r+1}(x^1,\dots,x^r),\dots,\bar{f}^n(x^1,\dots,x^r))\),我们只需构造值域的坐标变换,将后面的 \(n-r\) 个分量消为0。

具体操作:

  1. 定义值域的映射 \(\bar{v}:V_1\to B\)\(V_1\)\(\mathbb{R}^n\) 中原点的邻域):

\[\bar{v}(y^1,y^2,\dots,y^n) = \left(y^1,\dots,y^r,\ y^{r+1}+\bar{f}^{r+1}(y^1,\dots,y^r),\ \dots,\ y^n+\bar{f}^n(y^1,\dots,y^r)\right) \]

  1. 验证 \(\bar{v}\) 是局部微分同胚:

    • \(\bar{v}(0)=0\):因为 \(\bar{f}^{r+j}(0,\dots,0)=f^{r+j}(u^{-1}(0))=f^{r+j}(0)=0\)
    • 计算Jacobi矩阵 \(D\bar{v}(y)\),它是分块下三角矩阵:

      \[D\bar{v}(y) = \begin{pmatrix} I_r & 0 \\ * & I_{n-r} \end{pmatrix}\]

      其行列式恒为1,处处非奇异。根据反函数定理,存在原点的邻域 \(V\subset V_1\),使得 \(\bar{v}:V\to \bar{v}(V)=B_0\subset B\)\(C^k\) 微分同胚。
  2. 复合得到最简形式:
    \(v=\bar{v}^{-1}\)(也是微分同胚),选取原点的邻域 \(U\subset U_1\) 使得 \(F\circ u^{-1}(U)\subset B_0\),令 \(A_0=u^{-1}(U)\)\(a=0\) 的邻域)。

    对任意 \(x=(x^1,\dots,x^m)\in U\),记 \(y=F\circ u^{-1}(x)=(x^1,\dots,x^r,\bar{f}^{r+1}(x^1,\dots,x^r),\dots,\bar{f}^n(x^1,\dots,x^r))\),则 \(v(y)=\bar{v}^{-1}(y)\)

    根据 \(\bar{v}\) 的定义,\(\bar{v}(z)=y\) 等价于:

    \[y^1=z^1,\dots,y^r=z^r,\quad y^{r+j}=z^{r+j}+\bar{f}^{r+j}(y^1,\dots,y^r) \]

    解得 \(z^{r+j}=y^{r+j}-\bar{f}^{r+j}(y^1,\dots,y^r)=0\),因此:

    \[v(y) = (z^1,\dots,z^r,z^{r+1},\dots,z^n) = (x^1,\dots,x^r,0,\dots,0) \]

    \(v\circ F\circ u^{-1}(x)=(x^1,\dots,x^r,0,\dots,0)\),完全符合定理的标准形。


综上,四步证明完毕,秩定理成立。

2.4 秩定理的推论

我们可以选取更规整的邻域,让坐标变换更具几何直观:

  1. 可选取 \(U,V\) 为以原点为中心的开球 \(B_\varepsilon^m(0),B_\varepsilon^n(0)\),或开立方体 \(C_a^m(0),C_a^n(0)\)\(C_a^s(0)=\{x\in\mathbb{R}^s\mid |x^j|<a,\forall j\}\));
  2. \(\pi:\mathbb{R}^r\times\mathbb{R}^{n-r}\to\mathbb{R}^r\) 为到前 \(r\) 个坐标的投影,\(i:\mathbb{R}^r\to\mathbb{R}^r\times\{0\}\subset\mathbb{R}^m\) 为单射,则 \(\pi\circ v\circ F\circ u^{-1}\circ i\) 是开球/开立方体上的恒同映射。

三、Sard定理

Sard定理是微分拓扑的核心定理之一,它刻画了光滑映射临界点的“稀缺性”,为横截性理论、Morse理论、流形的嵌入定理等提供了基础。

3.1 临界点与临界值的定义

定义1.1.4 临界点与临界值
\(U\)\(\mathbb{R}^m\) 的开子集,\(F:U\to\mathbb{R}^n\)\(C^k\)\(k\geq1\))映射。

  1. \(a\in U\),若 \(DF(a)\) 的秩小于 \(n\),则称 \(a\) 是映射 \(F\)临界点
  2. \(a\) 是临界点,则对应的 \(F(a)\in\mathbb{R}^n\) 称为临界值
  3. 不是临界值的点称为正则值(即使它没有原像,也属于正则值)。

3.2 定理内容

定理1.1.7 Sard定理
\(F:U\to\mathbb{R}^n\)\(C^k\) 映射,其中光滑性满足 \(k\geq\max\left\{1,\frac{m}{n}\right\}\)\(U\)\(\mathbb{R}^m\) 的开子集。
\(A=\{a\in U\mid a\text{ 是 }F\text{ 的临界点}\}\),则临界值的集合 \(F(A)\)\(\mathbb{R}^n\) 中的Lebesgue测度为零

3.3 定理解读与说明

  1. 核心意义:Sard定理告诉我们,光滑映射的临界值是“极其稀少”的——在 \(\mathbb{R}^n\) 中测度为零,也就是说,\(\mathbb{R}^n\) 中几乎所有的点都是正则值
  2. 光滑性条件
    • \(m\leq n\) 时,\(\max\left\{1,\frac{m}{n}\right\}=1\),即只要 \(F\)\(C^1\) 映射,定理就成立;
    • \(m>n\) 时,需要更高的光滑性,例如 \(m=3,n=2\) 时需要 \(k\geq2\)\(m=4,n=2\) 时需要 \(k\geq2\)。若光滑性不满足,存在反例使得Sard定理不成立。
  3. 经典应用
    • 曲面论中,几乎所有的高度函数都是Morse函数(非退化临界点);
    • 流形的嵌入定理:任意 \(m\) 维光滑流形都可以嵌入到 \(\mathbb{R}^{2m+1}\) 中;
    • 横截性定理:几乎所有的光滑映射都与给定的子流形横截。

四、核心知识点系统归纳表

知识点分类 名称 核心定义/定理内容 关键性质与几何意义
基础概念 映射的秩 \(C^k\) 映射 \(F:U\to\mathbb{R}^n\) 在点 \(x\) 的秩,等于其Jacobi矩阵 \(DF(x)\) 的秩 映射与微分同胚复合后,秩保持不变,是秩定理的基础
核心定理 秩定理 \(C^k\) 映射 \(F:A\to B\) 在开集上的秩恒为 \(r\),则存在局部微分同胚 \(u,v\),使得 \(v\circ F\circ u^{-1}\) 化为标准形 \((x^1,\dots,x^r,0,\dots,0)\) 1. 线性代数秩标准形的非线性推广;
2. 完全刻画了常秩光滑映射的局部结构;
3. 反函数定理是其满秩特例
基础概念 临界点/临界值 \(DF(a)\) 的秩小于 \(n\),则 \(a\) 是临界点,\(F(a)\) 是临界值 临界点是映射失去局部满秩性的点,是映射的“退化点”
核心定理 Sard定理 满足光滑性条件的 \(C^k\) 映射,其临界值集合在 \(\mathbb{R}^n\) 中的Lebesgue测度为零 1. 光滑映射的临界值极其稀少,几乎所有点都是正则值;
2. 是微分拓扑、Morse理论、横截性理论的基石

最终总结

秩定理与Sard定理是反函数定理的两大核心延伸:

  • 秩定理解决了局部结构问题:它告诉我们,只要光滑映射的秩保持常数,无论其非线性形式多复杂,都可以通过光滑坐标变换化为最简的投影形式,将线性代数的结论完美推广到非线性场景,是子流形理论的核心基础。
  • Sard定理解决了整体稀缺性问题:它告诉我们,光滑映射的退化点(临界值)在测度意义下可以忽略不计,为我们用“几乎所有”的正则点研究映射的整体性质提供了理论保证,是微分拓扑的核心支柱。

posted on 2026-03-10 13:10  Indian_Mysore  阅读(2)  评论(0)    收藏  举报

导航