《微积分 A2》学习笔记 I —— 多元函数的极限，连续，微分和偏导数

\[% 希腊字母 \def \a {\alpha} \def \b {\beta} \def \d {\delta} \def \eps {\varepsilon} \def \g {\gamma} \def \la {\lambda} \def \o {\omega} \def \O {\Omega} \def \ph {\varphi} \def \t {\theta} \def \D {\Delta} \def \G {\Gamma} \def \s {\sigma} \def \S {\Sigma} % mathrm & mathbb \def \dd {\mathrm{d}} \def \DD {\mathrm{D}} \def \e {\mathrm{e}} \def \i {\mathrm{i}} \def \N {\mathbb{N}} \def \Z {\mathbb{Z}} \def \Q {\mathbb{Q}} \def \R {\mathbb{R}} \def \C {\mathbb{C}} % 环境 \def \bf {\mathbf} \def \rm {\mathrm} \def \sf {\mathsf} \def \tt {\texttt} \def \al {\mathcal} \def \scr {\mathscr} \def \op {\operatorname} \def \bal{\begin{aligned}} \def \eal {\end{aligned}} \def \bc {\begin{cases}} \def \ec {\end{cases}} \def \bpm {\begin{pmatrix}} \def \epm {\end{pmatrix}} \def \bvm {\begin{vmatrix}} \def \evm {\end{vmatrix}} % 数学符号 \def \l {\left} \def \r {\right} \def \fr {\frac} \def \sq {\sqrt} \def \pr {\Pr} \def \pif {{+\infty}} \def \ov {\overline} \def \ud {\underline} \def \bs {\backslash} \def \sm {\setminus} \def \mps {\mapsto} \def \str {\stackrel} \def \dash {\textendash} \def \gr {\op{grad}} \def \tr {\op{tr}} \def \na {\nabla} \def \pa {\partial} \def \fo {\forall} \def \xeq {\xlongequal} \def \szn {\sum_{i = 0} ^ n} \def \son {\sum_{i = 1} ^ n} \newcommand{\abs}[1]{\left| #1 \right|} \newcommand{\nm}[1]{\| #1 \|} \newcommand{\an}[1]{\left \langle #1 \right\rangle} % 微积分 \def \ait {\int_{-\infty} ^ \pif} % all intergral \def \git {\int_0 ^ \pif} \def \lan {\langle} \def \ran {\rangle} \newcommand{\infn}[1]{\| #1 \|_{\infty}} % 质因数 \def \gd {\mathcal N} % Gaussian distribution \def \var {\mathrm {Var}} % 普物 \def \hx {\hat x} \def \hy {\hat y} \def \hz {\hat z} \def \hr {\hat r} \def \ht {\hat \t} \def \vr {\vec r} \def \vt {\vec \tau} \def \vv {\vec v} \def \vf {\vec F} \def \va {\vec a} \def \vl {\vec L} \def \vp {\vec p} \def \vo {\vec \omega} \def \dv {\op{div}} \def \cu {\op{curl}} % 计算理论 \newcommand{\tm}[1]{\mathcal{O}{\l(#1\r)}} \def \lr {\leftrightarrow} \def \vd {\vdash} \def \vD {\vDash} \def \fo {\forall} \def \ex {\exists} \def \ra {\Rightarrow} \def \ras {\Rightarrow ^ *} \def \poly {\mathsf{poly}} \def \TIM {\mathsf{TIME}} \def \NTIM {\mathsf{NTIME}} \def \P {\mathsf{P}} \def \NP {\mathsf{NP}} \def \NPC {\mathsf{NPC}} \def \NPH {\mathsf{NPH}} \def \EXP {\mathsf{EXP}} \def \NEXP {\mathsf{NEXP}} \def \SP {\mathsf{SPACE}} \def \NSP {\mathsf{NSPACE}} \def \PSP {\mathsf{PSPACE}} \def \PSPC {\mathsf{PSPACE\, \dash \, Complete}} \def \PSPH {\mathsf{PSPACE\, \dash \, Hard}} \def \NPSP {\mathsf{NPSPACE}} \def \L {\mathsf{L}} \def \NL {\mathsf{NL}} \def \NLC {\mathsf{NLC}} \def \NLH {\mathsf{NLH}} \def \PA {\mathsf{PATH}} \def \SAT {\mathsf{SAT}} \def \TQBF {\mathsf{TQBF}} \def \UST {\mathsf{USTCON}} \]

微积分 A2？微积分 W2！微积分 F2！数学分析！

201 多元函数的极限与连续 1

多元函数初体验！

和一元微积分一样，“近似” 是多元微积分的主要思想。函数在一点附近的值近似该点的值就是连续，线性函数近似函数在一点处附近的行为就是微分。对近似程度的刻画离不开空间中 “距离” 的定义，为此需要引入 “范数” 和 “内积” 的概念。

距离给出了一些拓扑概念：开集闭集，内点聚点。这些是继承了一元微积分。

多元微积分的极限和连续和一元微积分差不多，它们的性质也很相似。

极限的性质：完备性（Cauchy 列有极限），列紧性（有界点列有收敛子列），范数的等价性。
连续的性质：连通性（连续函数将道路连通集映为道路连通集），最值性（有界闭集上的连续函数有最值且一致连续）。

多元函数

定义

多元函数变量个数有限且大于 \(1\)。当定义域是 \(\R ^ m\) 的子集时，所有变量可共同看成 \(\R ^ m\) 上的点，\(x ^ i\) 表示原像的第 \(i\) 个分量。

多元函数 例：地球表面的海拔高度 \(f : \mathbb{S} ^ 2 \to \R\)（由经维度确定海拔）。

多元映射 例：球坐标变换 \(F : [0, +\infty] \times [0, 2\pi)\times [0, \pi]\to \R ^ 3\)，\((r, \ph, \t) \mps (x, y, z)\)，其中 \(x = r\sin \t \cos \ph\)，\(y = r\sin \t \sin \ph\)，\(z = r\cos \t\)。\(\t\) 表示从北极向南极转的角度（和地理纬度不同），\(\ph\) 表示沿赤道转的角度。

向量场（像集是向量空间）例：风。\(y ^ i\) 表示像的第 \(i\) 个分量。

描绘多元函数图像的降维手段：等高线。

距离、范数与内积

根据一元函数的知识预测，

极限：\(\lim_{\bf x\to \bf x_0} F(\bf x)\)。
连续：当 \(\bf x\) 接近 \(\bf x_0\) 时，\(F(\bf x)\) 接近 \(F(\bf x_0)\)。
可微：当 \(\bf x\) 接近 \(\bf x_0\) 时，\(F(\bf x) - F(\bf x_0)\) 可以用关于 \(\bf x - \bf x_0\) 的简单（多项式）映射近似。

重要问题：“接近”，“近似” 的定义离不开 距离的度量。

距离

集合 \(M\) 上的距离 \(d: M\times M\to \R\) 满足

正定：\(\forall \bf x, \bf y:d(\bf x, \bf y) \ge 0; \ d(\bf x, \bf y) = 0\iff \bf x = \bf y\)。
对称。
三角形不等式：\(\forall \bf x, \bf y, \bf z : d(\bf x, \bf z) \leq d(\bf x, \bf y) + d(\bf y, \bf z)\)。

\(M\) 可以是 \(\R ^ n\) 或 \(\R ^ n\) 中的曲面、曲线、函数空间等。

线性空间上的距离

要求 平移不变：\(\forall \bf x, \bf y, \bf u \in \R ^ m: d(\bf x, \bf y) = d(\bf x + \bf u, \bf y + \bf u)\)。

范数 \(\|\cdot\| : \R ^ m\to \R\)，\(\| \bf x \|\) 是向量 \(\bf x\) 的长度，满足

正定：\(\| \bf x \| = 0 \iff \bf x = \bf 0\)。
正齐次：\(\| \la \bf x\| = \abs{\la} \| \bf x\|\)。
三角形不等式：\(\|\bf x\| + \|\bf y\| \geq \| \bf x + \bf y \|\)。

由范数确定了平移不变距离 \(d(\bf x, \bf y) = \| \bf x - \bf y \|\)，等式左侧的 \(\bf x, \bf y\) 是点，右侧是向量。

使用坐标计算范数

给定 \(m\) 维 \(\R\)-线性空间 \(V\) 的一组基 \(\e_{1..m}\)。对任意 \(\bf x\in V\)，存在一组数 \(x ^ {1..m}\) 使得 \(\bf x = \sum_{i = 1} ^ m x ^ i \bf \e_i\)。此意义下，所有 \(m\) 维 \(\R\)-线性空间都线性同构于 \(\R ^ m\)。

\[\| \bf x \| \le \sum_{i = 1} ^ m |x ^ i| \| \bf e_i \| \le \l (\sum_{i = 1} ^ m \, \| \bf e_i \| \r) \l(\max_{i = 1} ^ m |x ^ i| \r), \l(\sum_{i = 1} ^ m |x ^ i| \r) \l(\max_{i = 1} ^ m\, \| \bf e_i \| \r). \]

可以验证

\[\infn{\bf x} := \max_{i = 1} ^ m |x ^ i|, \quad \| \bf x\|_1 := \sum_{i = 1} ^ m |x ^ i| \]

都是 \(V\) 上的范数，且由上一条不等式可知对 \(V\) 上的任何范数 \(\| \cdot \|\)，存在常数 \(M > 0\) 使得

\[\| \bf x\| \le M \infn{\bf x}, \ \forall x\in V. \]

这说明 若两个点在无穷范数上接近，则它们在任何范数上接近。接下来会证明该结论反过来也成立，这是 极限过程与范数选择无关 的基础。

\(p\)-范数

对 \(p\ge 1\) 定义 \(p\)-范数

\[\| \bf x\|_p := \l(\sum_{i = 1} ^ m |x ^ i| ^ p\r) ^ {\frac 1 p}. \]

对一般的 \(p\) 证明 \(\| \bf x\|_p\) 满足三角形不等式需要 110 节的 Minkowski 不等式。

一维数轴只有一个范数，若规定 \(\| 1\| = 1\)。

内积

线性空间 \(V\) 上的内积是二元函数 \(B : V\times V\to \R\) 满足

对称。
双线性：固定一个变量，关于另一个变量具有线性。
正定：\(B(\bf x, \bf x)\ge 0; \ B(\bf x, \bf x) = 0\iff \bf x = 0\)。

记为 \(\bf x\cdot \bf y\)。

由内积可以度量两个向量的夹角。

由内积得欧几里得范数 \(\| \bf x\| := \sqrt {\bf x\cdot \bf x}\)，满足 Cauchy-Schwarz 不等式 \(|\bf x\cdot \bf y | \le \| \bf x\| \| \bf y\|\)，等号成立当且仅当存在 \(\la\in \R\) 使得 \(\bf x = \la \bf y\) 或 \(\bf y = \la \bf x\)。

\(V\) 上的范数 \(\| \cdot \|\) 可由适当内积得到，当且仅当其满足广义勾股定理
\[\| \bf x + \bf y\| ^ 2 + \| \bf x - \bf y\| ^ 2 = 2(\| \bf x \| ^ 2 + \| \bf y \| ^ 2). \]

由距离定义的拓扑概念

以 \(\bf x_0 \in V\) 为中心，以 \(r > 0\) 为半径的开球是

\[B_r(\bf x_0) = \{\bf x\in V \mid \| \bf x - \bf x_0\| < r\}. \]

称 \(U\) 是 \(\bf x_0\in V\) 的邻域（\(\bf x_0\) 是 \(U\) 的内点）：存在 \(r > 0\) 使得 \(B_r(\bf x_0)\subset U\)。

称 \(U\) 是 \(V\) 中的开集：\(U\) 是它的每个点的邻域（对内点封闭）。

称 \(\bf x_0\) 为集合 \(A\) 的聚点：\(\forall \eps > 0, \ \exists \bf x \in A : 0 < \| \bf x - \bf x_0\| < \eps\)。

称 \(A\) 是闭集：\(\forall \bf x: \bf x\) 是聚点 \(\implies \bf x\in A\)（对聚点封闭）。

极限与连续

点列极限

设 \(V\) 是有限维线性空间，点列 \(\bf x_n \in V\)，则

\[\lim_{n\to +\infty} \bf x_n = \bf x : \lim_{n\to +\infty} \| \bf x_n - \bf x\| = 0. \]

注意 距离和范数有关，但最终会证明 极限和范数无关。

点列 \(\bf x_n\in V\) 是 Cauchy 列，若

\[\forall \eps > 0,\ \exists N \ge 1,\ \forall n, p\in \N ^ *,\ n\ge N : \| \bf x_{n + p} - \bf x\| < \eps. \]

极限

设 \(V, W\) 是有限维线性空间，\(\| \cdot \|_V\) 和 \(\| \cdot \|_W\) 是空间上的范数。对 \(f : A\to W\ (A\subset V)\)，\(\lim_{\bf x\to \bf x_0} f(\bf x) = L\) 要求 \(\bf x_0\) 是 \(A\) 的聚点，且

\[\forall \eps > 0, \ \exists \delta > 0,\ \forall x < A: 0 < \| \bf x - \bf x_0\|_V < \delta \implies \| f(\bf x) - L\|_W < \eps. \]

连续

\(\bf x_0\in A\) 且 \(\lim_{\bf x\to \bf x_0} f(\bf x) = f(\bf x_0)\)。

极限与连续的联系参考一元微积分。

结论（极限）

对任何有限维 \(\R\) 线性空间 \(V\) 和任何范数 \(\| \cdot \|\)，

完备性：所有 Cauchy 列收敛。
列紧性：有界点列有收敛子列。
任何两个范数等价，因为 \(\| \cdot \|\) 和 \(\| \cdot \|_{\infty}\) 等价：存在 \(0 < M_1 < M_2\) 使得

\[M_1\infn{\bf x}\le \| \bf x\| \le M_2 \infn{\bf x}, \ \forall \bf x\in V. \]

结论 3 的不等式很重要，我们可以 选择最合适的范数解决问题而无需考虑范数之间的转化问题。它结合前两条结论可以推出点列 “在 \(\| \cdot \|\) 下有界 / 收敛 / Cauchy” 等价于 “在 \(\| \cdot \|_{\infty}\) 下有界 / 收敛 / Cauchy”，等价于 “坐标数列 \(\{x_n ^ i\}\) 有界 / 收敛 / Cauchy”，进一步知 \(f: V\to \R\) 的极限和连续性与范数的选择无关。

容易对无穷范数证明结论 1 和 2，点列极限和数列极限以无穷范数为桥梁相互转化。已知结论 3 的第二个不等号，关键是第一个不等号。

存在常数 \(M > 0\) 使得 \(\forall \bf x \in V : \infn{\bf x} \le M\| \bf x\|\)。

证明

假设对任意正整数 \(n\)，存在 \(\bf x_n : \infn{\bf x_n} > n\| \bf x_n\|\)。

记 \(\bf y_n = \fr {\bf x_n} {\infn{\bf x_n}}\)，则 \(\infn{\bf y_n} = 1\) 且 \(\| \bf y_n\| < \fr 1 n\)。

在无穷范数的单位球面上找了一列点，点列的极限为原点，极限存在由 \(\infn{\bf y_n}\) 有界结合无穷范数的列紧性而非 \(\|\bf y_n\| < \fr 1 n\) 保证。

\(\bf y_n\) 在 \(\| \cdot \|_{\infty}\) 下有收敛子列，因此不妨设 \(\lim_{n\to +\infty} \infn{\bf y_n - \bf y} = 0\)，则

\[\infn{\bf y} \ge \infn{\bf y_n} - \infn{\bf y_n - \bf y} \to 1, \quad n\to +\infty. \]
但

\[\| \bf y\| \le \| \bf y_n\| + \| \bf y_n - \bf y \| \le \fr 1 n + M \infn{\bf y_n - \bf y} \to 0. \]
因此 \(\bf y = \bf 0\)，这与 \(\infn {\bf y} \ge 1\) 矛盾。\(\square\)

注意：列紧性在无穷维不适用；任何范数被无穷范数所控制在无穷维不适用。

结论（连续）

对有限维 \(\R\) 线性空间 \(V, W\) 以及连续映射 \(f: V\to W\)，

连通性：若 \(A\subset V\) 是道路连通集，则 \(f(A)\) 也是道路连通集。一元函数 介值定理 的推广。
最值性：若 \(A\subset V\) 是有界闭集，则 \(f(A)\) 也是有界闭集，且 \(f\) 在 \(A\) 上 一致连续。一元函数 最值定理 的推广。

道路连通集：对任意 \(P, Q\in A\)，存在连续映射 \(\gamma: [0, 1] \to V\) 使得

\[\forall t\in [0, 1]: \gamma(t) \in A;\ \gamma(0) = P,\ \gamma(1) = Q. \]

结论 1：先在 \(A\) 中找到连通 \(P, Q\) 的道路，再映射到像集，就是连通 \(f(P), f(Q)\) 的道路。用到了连续函数的复合也是连续函数。

结论 2 的证法和最值定理类似。

\(A\subset V\) 有界闭等价于 \(A\) 中所有点列有收敛子列，且极限在 \(A\) 中。

必要性

设 \(\bf x_n\in A\)，则 \(\bf x_n\) 有界，有收敛子列 \(\lim_{k\to +\infty}\bf x_{n_k} = \bf x\)。

假设 \(\bf x\notin A\)，则 \(\bf x_{n_k}\neq \bf x\)，从而 \(\bf x\) 是 \(A\) 的聚点，而 \(A\) 是闭集，所以 \(\bf x\in A\)，矛盾。因此 \(\bf x\in A\)。

充分性

假设 \(A\) 无界，则存在 \(\bf x_n\) 满足 \(\| \bf x_n\| > n\)，无收敛子列。

假设 \(A\) 不是闭集，则存在 \(\bf x_n\) 满足 \(\lim_{n\to +\infty} \bf x_n = \bf x\notin A\)，任何子列收敛至 \(\bf x\)。\(\square\)

通过上述对有界闭集的刻画，证明结论 2。

\(A\subset V\) 有界闭，\(f: V\to W\) 连续，则 \(f(A)\) 有界闭。

证明

任取 \(\bf y_n\in f(A)\)，存在 \(\bf x_n\in A\) 使得 \(f(\bf x_n) = \bf y_n\)，有收敛子列 \(\bf x_{n_k}\) 极限为 \(\bf x\in A\)。

根据 \(f\) 的连续性，\(\lim_{k\to +\infty} \bf y_{n_k} = f(\lim_{k\to +\infty} \bf x_{n_k}) = f(\bf x)\in f(A)\)，因此 \(f(A)\) 有界闭。\(\square\)

保持结论 2 条件不变，当 \(W = \R\) 时，\(f\) 在 \(A\) 上 有最值。

一致连续：\(\forall \eps > 0,\ \exists \delta > 0\) 使得 \(\forall \bf x, \bf y\in A : \| \bf x - \bf y\|_{V} < \delta \implies \| f(\bf x) - f(\bf y)\|_W < \eps\)。

结论 2 的一致连续性证明同一元微积分。

例 1

设 \(A\subset V\) 是闭集，\(f: [a, b]\times A \to \R\) 连续，记 \(g(\bf y) = \int_a ^ b f(x, \bf y)\dd x\)。证明 \(g\) 在 \(A\) 上连续：

\[\forall \bf y_0\in A : \lim_{\bf y\to \bf y_0} \int_a ^ b f(x, \bf y) \dd x = \int_a ^ b \lim_{\bf y \to \bf y_0} f(x, \bf y) \dd x. \]

含参积分对参数的连续性。

证明

任取 \(\bf y_0\in A\)，\(\forall \eps > 0,\ \exists \delta > 0\) 使得当 \(\| \bf y - \bf y_0\| < \delta\) 时，\(|f(x, \bf y) - f(x, \bf y_0)| < \eps\)。因此

\[|g(\bf y) - g(\bf y_0)| \leq \int_a ^ b |f(x, \bf y) - f(x, \bf y_0)|\leq \eps(b - a). \]
这个证明有问题！证明 \(g\) 连续时，给定 \(\eps\) 对应的 \(\delta\) 只能和 \(\bf y_0\) 有关，但积分时要求 \(\forall x\in [a, b]\) 均有 \(|f(x, \bf y) - f(x, \bf y_0)| < \eps\)，即 \(\delta\) 要满足无穷多个 \(x\) 的限制。

补丁：一致连续。一致连续要求 \([a, b]\times A\) 有界，但 \(A\) 可能无界。固定 \(\bf y_0\) 时，只关心 \(\bf y_0\) 附近的 \(\bf y\)，而和 \(A\) 是否有界无关，即令 \(A' = A\cap \{\bf y \mid \| \bf y - \bf y_0\| \leq 1\}\)。\(\square\)

一元和多元的本质不同之一：关于其它变量的一致性。

202 多元函数的极限与连续 2

多元函数的极限很复杂，因为逼近方式无穷无尽。给出了很多有意思的例子。

一元微积分里的无穷小量，大 O，小 o 和同阶的概念直接搬过来用。

复合函数的连续性及应用：数学分析！

多元函数的复杂性

例 1

\[\lim_{(x, y)\to (0, 0)} \fr {x y} {x ^ 2 + y ^ 2}. \]
解

\[\lim_{n\to +\infty} f\l(\fr 1 n, 0\r) = 0, \quad \lim_{n\to +\infty} f\l(\fr 1 n , \fr 1 n\r) = \fr 1 2. \]
沿不同方向逼近 \((0, 0)\) 得到的极限不同，极限不存在。

另一种思路：函数的等高线是所有过原点的直线。这些等高线汇聚到原点，所以原点处一定没有极限。

例 2

\[\lim_{(x, y)\to (0, 0)} \fr {x ^ 2y} {x ^ 4 + y ^ 2}. \]
解

尽管

\[\lim_{x\to 0} f(x, tx) = \lim_{x\to 0} \fr {tx} {x ^ 2 + t ^ 2} = 0, \]
即直线方向上原点处极限为 \(0\)，但

\[f(x, tx ^ 2) = \fr {t} {1 + t ^ 2}. \]
所以极限不存在。

对一元函数，极限存在等价于左右极限存在且相等。但 多元函数的空间结构使得逼近方式无穷无尽，极限过程相较一元函数复杂得多。

例 3

\[\lim_{(x, y)\to (0, 0)} \fr{xy} {x + y}. \]
解

\[\lim_{n\to +\infty} f\l(\fr 1 n, 0\r) = 0, \]
但

\[f\l(\fr 1 n, -\fr 1 n + \fr 1 {n ^ 3}\r) = -n + \fr 1 n. \]
所以极限不存在。

对于一元函数，当 \(x\to 0\) 时，齐次多项式是无穷小量，次数越高阶越高。但多元函数 次数更高的齐次多项式的收敛速度不一定更快。

考虑

\[f(x, y) = \bc 0, & y\neq x ^ 2 \lor x = y = 0; \\ 1, & y = x ^ 2 > 0. \ec \]

\(f\) 沿过原点的任何直线都在原点处连续，但 \(f\) 在原点处不连续。

若 \(y_0 \neq x_0 ^ 2\)，则 \(\lim_{(x, y)\to (x_0, y_0)} f(x, y) = 0 = f(x_0, y_0)\)；若 \(y_0 = x_0 ^ 2\)，则极限不存在。

先固定一个变量，则

\[\lim_{y\to 0} \lim_{x\to 0} f(x, y) = 0 = \lim_{x\to 0} \lim_{y\to 0} f(x, y). \]

此为 重极限（多元极限）和 累次极限 的不同之处。

对二元函数，若（二）重极限和一个累次极限存在，则这两个极限相等。若重极限不存在，则累次极限可以是任何情况。

例 4

\[\lim_{(x, y)\to (0, 0)} x ^ y. \]
解

函数等高线 \(x ^ y = k\iff y = \fr {\ln k} {\ln x}\)。因为 \(\lim_{x\to 0 ^ +} \ln x = -\infty\)，所以对于不同的 \(k\)，等高线最终都会汇聚到原点处，\(x ^ y\) 在原点处没有极限。

若给定 \(\a > 0\)，限制函数定义域 \(A = \{(x, y)\mid x > 0,\ |y| \leq Cx ^ {\a}\}\)，则

\[\abs {y\ln x} \leq Cx ^ {\a} \abs {\ln x} \to 0, \quad x\to 0 ^ +. \]
即

\[\lim_{A\ni(x, y)\to (0, 0)} x ^ y = 1. \]

上例体现了 函数定义域对函数极限的影响。

无穷小量、同阶

\(\bf x\to \bf a\) 时，\(f(\bf x)\) 是 无穷小量：\(\lim_{\bf x\to \bf a} f(\bf x) = 0\)。

\(\bf x\to \bf a\) 时，\(f(\bf x) = O(g(\bf x))\)：\(\exists M > 0\) 以及 \(\bf a\) 的邻域 \(U\)，使得

\[\forall \bf x \in (U\cap A)\bs \{\bf a \}: \| f(\bf x)\| \leq M \| g(\bf x)\|. \]

\(\bf x\to \bf a\) 时，\(f(\bf x) = o(g(\bf x))\)：\(\forall \eps > 0\)，存在 \(\bf a\) 的邻域 \(U_{\eps}\)，使得

\[\forall \bf x \in (U_{\eps}\cap A)\bs \{\bf a \}: \| f(\bf x)\| \leq \eps \| g(\bf x)\|. \]

极限：\(\lim_{\bf x\to \bf a} f(\bf x) = L\iff f(\bf x) - L = o(1),\ \bf x\to \bf a\)。

连续：\(f\) 在 \(\bf x_0\) 处连续 \(\iff\) \(f(\bf x) = f(\bf x_0) + o(1), \ \bf x\to \bf x_0\)。

\(\bf x\to \bf a\) 时，\(f(\bf x), g(\bf x)\) 同阶：\(f(\bf x) = O(g(\bf x))\)，\(g(\bf x) = O(f(\bf x))\)。

以上所有概念与范数的选择无关。特别地，对于 \(O\) 和 \(o\) 记号，不要求 \(f, g\) 的像集相同。

黄皮教材将函数同阶定义为比值极限存在且非零，这种定义有缺陷。考虑下例。

例 1

\[\lim_{(x, y)\to (0, 0)} \fr {ax ^ 2 + 2bxy + cy ^ 2} {x ^ 2 + y ^ 2}. \]
解

将函数写成极坐标形式

\[\fr {ax ^ 2 + 2bxy + cy ^ 2} {x ^ 2 + y ^ 2} = a\cos ^ 2 \t + b\sin 2\t + c\sin ^2 \t = \fr {a - c} 2 \cos 2\t + b\sin 2\t + \fr {a + c} 2. \]
所求极限存在当且仅当 \(b = 0\) 且 \(a = c\)，此时分子为 \(a(x ^ 2 + y ^ 2)\)，函数恒为 \(a\)。

分母对应标准圆，二阶无穷小。分子对应椭圆。这样定义，即使是椭圆也不能算二阶无穷小。用比值极限定义同阶，这个概念将变得无聊且无用。

警惕经验对思维造成的局限。

例 2

\(ax ^ 2 + 2bxy + cy ^ 2\) 和 \(x ^ 2 + y ^ 2\) 同阶当且仅当 \(b ^ 2 < ac\)。

充分性

根据绝对值不等式和基本不等式，有

\[|ax ^ 2 + 2bxy + cy ^ 2| \leq |a|x ^ 2 + 2|b||xy| + |c|y ^ 2 \leq (|a| + |b| + |c|) (x ^ 2 + y ^ 2). \]
设 \(ac > b ^ 2\)，不妨设 \(a, c > 0\)，则存在 \(\eps > 0\) 使得 \(b ^ 2 < (a - \eps) (c - \eps)\)，从而

\[\bal |ax ^ 2 + 2bxy + c y ^ 2| & \geq ax ^ 2 - 2|b||xy| + c y ^ 2 \\ & = (a - \eps) x ^ 2 - 2|b||xy| + (c - \eps) y ^ 2 + \eps(x ^ 2 + y ^ 2) \\ & \geq \eps (x ^ 2 + y ^ 2). \eal \]
即若 \(b ^ 2 < ac\)，则同阶。

必要性

设 \(T = \abs {\fr {ax ^ 2 + 2bxy + cy ^ 2} {x ^ 2 + y ^ 2}}\)。若 \(ax ^ 2 + 2bxy + cy ^ 2\) 和 \(x ^ 2 + y ^ 2\) 不同阶，则 \(T\) 的最小值为 \(0\)。

使用降幂公式和辅助角公式，计算得

\[T = \abs {\sqrt {\fr {(a - c) ^ 2} 4 + b ^ 2} \cos(2\t + \ph) + \fr {a + c} 2}. \]
于是 \(T_{\min} = 0\) 当且仅当 \(\abs{\fr {a + c} 2} \leq \sqrt {\fr {(a - c) ^ 2} 4 + b ^ 2}\)，即 \(b ^ 2 \geq ac\)。

当 \(a, c > 0\)，\(ac > b ^ 2\) 时，

\[axu + b(xv + yu) + cyv \]

定义了 \(\R ^ 2\) 上向量 \((x, y)\) 与 \((u, v)\) 的内积，从而

\[\| (x, y) \| = \sqrt {ax ^ 2 + 2bxy + cy ^2} \]

是 \(\R ^ 2\) 上的范数，和 \(2\)-范数等价。这说明当 \((x, y)\to (0, 0)\) 时，\(ax ^ 2 + 2bxy + c y ^ 2\) 和 \(x ^ 2 + y ^ 2\) 同阶。

连续映射

连续映射 \(f, g\) 的复合是连续映射。

常值映射是连续映射。

范数

根据范数的三角形不等式，\(\abs{\|\bf x \| - \| \bf y\|} \leq \| \bf x - \bf y\|\)。

线性映射

线性映射 \(L = V\to W\)，\(L(\la \bf x + \mu \bf y) = \la L(\bf x) + \mu L(\bf y)\)。因为

\[\| L(\bf x) \|\leq \infn{\bf x} \sum_{i = 1} ^ m \| L(\bf e_i)\| \leq M \| \bf x\|, \]

所以

\[\|L(\bf x) - L(\bf y) \| = \| L(\bf x - \bf y) \| \leq M \|\bf x - \bf y\|. \]

乘积空间和投影映射

线性空间 \(V_1, V_2\) 的乘积空间 \(V_1\times V_2 = \{(\bf v_1, \bf v_2) \mid \bf v_1 \in V_1,\ \bf v_2 \in V_2\}\) 是一个线性空间。\(\|(\bf v_1, \bf v_2)\| = \max(\|\bf v_1 \|, \| \bf v_2 \|)\) 是 \(V_1\times V_2\) 上的一个范数。

投影映射 \(\pi_k : V_1\times V_2\to V_k,\ (\bf v_1, \bf v_2) \mps \bf v_k\ (k = 1, 2)\) 是线性映射，从而是连续映射。

将一元连续函数 \(f(x)\) 强行看成多元函数 \(g(x, y, z) = f(x)\) 相当于复合 \((x, y, z)\mps x\mps f(x)\)，所以 \(g\) 连续。

最值函数

\(\max : \R ^ m\to \R,\ \max(x ^ 1, x ^ 2, \cdots, x ^ m)\)，而 \(\max(x ^ 1, x ^ 2) = \fr {x ^ 1 + x ^ 2} 2 + \abs {\fr {x ^ 1 - x ^ 2} 2}\)。加法是线性映射，所以是连续映射。

\(\min(\bf x) = -\max(-\bf x)\)。

*乘法：双线性映射

数乘 \(\R \times V \to V,\ (\la, \bf x)\mps \la \bf x\)。

内积 \(V\times V \to V,\ (\bf x, \bf y) \mps \bf x \cdot \bf y\)。

双线性型 \(\R ^ m\times \R ^ n\to \R, \ (\bf x, \bf y) \mps \bf x ^ T A\bf y\)。

双线性映射 \(B : V_1\times V_2 \to W\)，\(V_1, V_2, W\) 是线性空间，满足

\[\bal & B(\la \bf x_1 + \mu \bf x_2, \bf y) = \la B(\bf x_1, \bf y) + \mu B(\bf x_2, \bf y), \\ & B(\bf x, \la \bf y_1 + \mu \bf y_2) = \la B(\bf x, \bf y_1) + \mu B(\bf x, \bf y_2). \eal \]

因为

\[\begin{aligned} \|B(\bf x, \bf y)\| & \leq \sum_{i, j} |x ^ i||y ^ j|\| B (\bf e_i, \bf f_j)\| \\ & \leq \infn {\bf x} \infn {\bf y}\sum_{i, j} \| B(\bf e_i, \bf f_j) \| \\ & \leq M \|\bf x\|_{V_1} \|\bf y \|_{V_2} \\ & \leq M_2 \| (\bf x, \bf y) \| ^ 2, \end{aligned} \]

其中最后一个不等式的依据是投影映射，所以根据 \(B\) 的双线性，在 \((\bf x, \bf y) \to (\bf 0, \bf 0)\) 时，

\[\|B(\bf x_0 + \bf x, \bf y_0 + \bf y) - B(\bf x_0, \bf y_0) \| = \| B(\bf x_0, \bf y) + B(\bf x, \bf y_0) + B(\bf x, \bf y)\| = O(\| (\bf x, \bf y)\|). \]

于是所有双线性映射都是连续映射。

一元微积分连续函数的乘积是连续函数。

*多重线性映射

\(m\) 重线性映射 \(L : V_1 \times \cdots \times V_m\to W\)，其中 \(V_k, W\) 是线性空间，且 \(L(\bf v_1, \cdots, \bf v_m)\) 关于每个 \(\bf v_k\) 线性。

所有多重线性映射都是连续映射，满足存在常数 \(M > 0\) 使得任取 \(\bf v_k\in V_k\)，都有

\[\| L(\bf v_1, \cdots, \bf v_m)\| \leq M \| \bf v_1 \| \cdots \|\bf v_m\| \]

当所有 \(V_k\) 和 \(\bf v\) 全部相等时，\(L(\bf v, \cdots, \bf v)\) 是 \(m\) 次齐次多项式，其范数被 \(\|\bf v\| ^ m\) 的常数倍所控制。

如 \(\det(A)\) 关于 \(A\) 的每个列向量线性，于是行列式 \(\det : \R ^ m \times \cdots \times \R ^ m \to \R\) 是关于方阵 \(A\) 的连续函数。

进一步地，由于 \(A\) 可逆当且仅当 \(\det (A) \neq 0\)，由行列式的连续性知，存在 \(\delta > 0\) 使得当 \(m\) 阶方阵 \(B\) 满足 \(\|B\| < \delta\) 时，\(\abs {\det(A + B) - \det (A)} < \fr 1 2 \det (A)\)，从而 \(\det (A + B) \neq 0\)。因此，将可逆矩阵进行小扰动之后，矩阵仍然可逆：可逆矩阵构成全体 \(m\) 阶实方阵 \(\mathcal M_m\) 中的开集。\(\mathcal M_m ^ +\) 和 \(\mathcal M_{m} ^ -\) 都是开集。

思考：\(\mathcal M_m ^ +\) 和 \(\mathcal M_{m} ^ -\) 是否道路连通？显然不连通。

例 1

设 \(A\) 为正定矩阵，证明 \(\bf x ^ TA\bf x\) 和 \(\bf x ^T \bf x\) 同阶。

证明

记 \(f(B)\) 为 \(B\) 的顺序主子式的最小值，则 \(B\) 正定当且仅当 \(f(B) > 0\)。

已知 \(f(A), f(I) > 0\) 且 \(f\) 连续，所以当 \(\eps\) 充分小时，\(f(A - \eps I) > 0\)，\(f(I - \eps A) > 0\)。从而 \(\forall \bf x\neq \bf 0\)，都有 \(\bf x ^ T(A - \eps I)\bf x > 0\)，\(\bf x ^ T (I - \eps A) \bf x > 0\)，因此

\[\frac 1 \eps \bf x ^ T \bf x > \bf x ^ T A \bf x > \eps \bf x ^ T\bf x \]
\(\square\)

另一证明

\(K = \{\bf x\in \R ^ m \mid \| \bf x\|_2 = 1\}\) 是非空有界闭集，\(g(\bf x) = \bf x ^ TA\bf x\) 是连续函数，在 \(K\) 上有最大值 \(M\) 和最小值 \(m\)。

由 \(\bf x ^ T\bf x = \| \bf x\| _2 ^ 2\)，对任意 \(\bf x\neq \bf 0\)，

\[m\leq g\l(\fr {\bf x}{\| \bf x\|_2}\r) \leq M \implies m\bf x ^ T\bf x\leq \bf x ^ TA\bf x\leq M\bf x ^T\bf x \]
\(\square\)

将 \(\bf x\) 单位化后在单位球上考虑是好用的证明技巧。

*203 多元函数的极限与连续 3

纯纯数学分析，不看了。

204 多元函数的微分与梯度

经历了一系列数学分析内容的洗礼，终于回归微积分了！

微分是切平面，是线性函数。梯度是原空间里包含了这个线性函数所有信息的向量。

可微与微分

设 \(A\) 是 \(V\) 的非空开集。

称 \(f: A\to W\) 在 \(\bf a\in A\) 处可微，若存在线性映射 \(L : V\to W\) 使得

\[f(\bf a + \bf x) = f(\bf a) + L \bf x + o(\bf x), \quad \| \bf x\|\to 0, \]

即

\[\lim_{\bf x\to \bf 0} \frac {\| f(\bf a + \bf x) - f(\bf a) - L\bf x \|} {\| \bf x\|} = 0. \]

记 \(\DD f(\bf a) = L\)，称为 \(f\) 在 \(\bf a\) 处的微分。

当 \(W = \R\) 即 \(f\) 是函数时写为 \(\dd f(\bf a)\)。

常值映射

常值映射 \(f\) 的微分 \(\DD f = 0\)。

线性映射

线性映射 \(L\) 的微分 \(\DD L = L\)。

双线性映射

\[B(\bf a + \bf x, \bf b + \bf y) = B(\bf a, \bf b) + B(\bf a, \bf y) + B(\bf x, \bf b) + B(\bf x, \bf y), \]

其中 \(B(\bf a, \bf y) + B(\bf x, \bf b)\) 对 \((\bf x, \bf y)\) 是线性的（但 \(B\) 本身不是线性，因为 \(B(\la \bf a, \la \bf b) = \la ^ 2 B(\bf a, \bf b)\)）。而

\[B(\bf x, \bf y) \leq M \| \bf x\| \| \bf y \| \leq M_1\|(\bf x, \bf y)\| ^ 2 = o(\|(\bf x, \bf y)\|), \quad (\bf x, \bf y)\to (\bf 0, \bf 0), \]

所以

\[\DD B(\bf a, \bf b)(\bf x, \bf y) = B(\bf a, \bf y) + B(\bf x, \bf b). \]

这是 Leibniz 公式。

特别地，对 \(f(\bf x) = B(\bf x, \bf x)\)，\(\DD f(\bf a) (\bf x) = B(\bf a, \bf x) + B(\bf x, \bf a)\)。

内积

内积 \(\lan \bf x, \bf y \ran\) 是双线性函数，其微分

\[\dd\an{,}(\bf a, \bf b) (\bf x, \bf y) = \lan \bf x, \bf b\ran + \lan \bf a, \bf y\ran. \]

向量积

\(\R ^ 3\) 中两个向量的向量积 \(\bf x\times\bf y\) 是双线性映射。\(f(\bf x, \bf y) = \bf x\times \bf y\) 的微分为

\[\DD f(\bf a, \bf b) (\bf x, \bf y) = \bf x\times \bf b + \bf a\times \bf y, \]

多重线性映射

对多重线性映射 \(L_m\)，

\[L_m(\bf a_1 + \bf x_1, \cdots, \bf a_m + \bf x_m) = L_m(\bf a_1, \cdots, \bf a_m) + \sum_{k = 1} ^ m L_m(\bf a_1, \cdots, \bf x_k, \cdots, \bf a_m) + o(\|(\bf x_1, \cdots, \bf x_m)\|). \]

所以

\[\DD L_m(\bf a)(\bf x) = \sum_{k = 1} ^ m L_m(\bf a_1, \cdots, \bf x_k, \cdots, \bf a_m). \]

行列式

行列式 \(\det\) 是 \(\R ^ m\times \cdots \times \R ^ m\) 上的 \(m\) 重多线性函数，则

\[\DD \det(A)(B) = \sum_{j = 1} ^ m \det(\bf a_1, \cdots, \bf b_j, \cdots, \bf a_m) = \sum_{j = 1} ^ m \sum_{i = 1} ^ m b_{i, j} A ^ *_{j, i} = \tr(A ^ * B), \]

其中 \(A ^ *\) 是 \(A\) 的伴随矩阵。

所以

\[\det(A + B) = \det A + \tr(A ^ * B) + o(B), \quad \| B\| \to 0. \]

*线性常微分方程组

\[\frac \dd {\dd t} \bf y(t) = A(t)\bf y(t). \]

任选基本解矩阵 \(Y(t)\)，即 \(Y(t)\) 可逆且

\[\frac {\dd} {\dd t} Y(t) = A(t)Y(t), \]

则

\[Y(s + t) = Y(s) + tTY'(s) + o(t) = Y(s) + tA(s)Y(s) + o(t), \quad t\to 0, \]

于是

\[Y(s + t)Y(s) ^ {-1} = I_m + tA(s) + o(t), \quad t\to 0, \]

从而

\[\det(Y(s + t)Y(s) ^ {-1}) = 1 + t\tr(A(s)) + o(t), \quad t\to 0, \]

所以

\[\left.\frac {\dd} {\dd t} \det Y(s + t)\right|_{t = 0} \frac {1} {\det Y(s)} = \tr A(s). \]

即 \(Y(t)\) 的行列式 \(W(t)\)（Wronsky 行列式）满足线性微分方程

\[W' = \tr A(s) \cdot W. \]

结论称为 Liouville 定理，它刻画了在 \(\bf y' = A(t)\bf y\) 下体积随时间的变化率。若 \(\tr A(t)\equiv 0\)，则体积恒定。

*矩阵求逆

对可逆矩阵 \(A\)，已知（略去的 203 小节的内容）

\[(A + B) ^ {-1} = A ^ {-1} - A ^ {-1}BA ^ {-1} + o(B), \quad \|B\|\to 0, \]

所以

\[\DD \mathrm{inv}(A)(B) = -A ^ {-1}BA ^ {-1}. \]

复合映射

复合的微分等于微分的复合。

\[\DD(g\circ f)(\bf a) = \DD g(\bf b) \circ \DD f(\bf a) = (\DD g)(f(\bf a)) \circ \DD f(\bf a). \]

证明

\[\bal g(f(\bf x + \bf u)) & = g(f(\bf x)) + \DD g(f(\bf x)) (f(\bf x + \bf u) - f(\bf x)) + o(f(\bf x + \bf u) - f(\bf x)) \\ & = g(f(\bf x)) + \DD g(f(\bf x)) (\DD f(\bf x)\bf u + o(\bf u)) + o(\DD f(\bf x)\bf u + o(\bf u)) \\ & = g(f(\bf x)) + \DD g(f(\bf x)) (\DD f(\bf x)\bf u) + \DD g(f(\bf x)) (o(\bf u)) + o(\bf u) \\ & = g(f(\bf x)) + \DD g(f(\bf x)) (\DD f(\bf x)\bf u) + o(\bf u). \\ \eal \]

范数

由

\[\| \bf x \| = \sqrt {\an {\bf x, \bf x}} \]

可知当 \(\bf x \neq \bf 0\) 时，\(\| \bf x \|\) 是可微函数，且

\[\dd \| \bf x \|(\bf u) = \frac 1 {2\sqrt {\an {\bf x, \bf x}}} \dd \an{\bf x, \bf x}(\bf u) = \frac 1 {2 \| \bf x \|}2\an {\bf x, \bf u} = \an {\fr {\bf x} {\| \bf x\|}, \bf u}. \]

*对偶映射

内积空间 \(V\) 中，线性映射 \(L\) 的对偶 \(L ^ T\) 也是线性映射，满足

\[\an {\bf x, L\bf y} = \an {L ^ T\bf x, \bf y}. \]

\(\an {\bf x, L\bf x}\) 是可微函数，有

\[\dd \an {\bf x, L\bf x} (\bf u) = \an {\bf u, L\bf x} + \an {\bf x, L\bf u} = \an {(L + L ^ T) \bf x, \bf u}. \]

导数与梯度

一元映射的导数

设 \(W\) 是线性空间，\(f : \R \to W\) 在 \(a\) 处可导，即极限

\[f'(a) = \lim_{t\to 0} \fr {f(a + t) - f(a)} t \in W \]

存在，称为 \(f\) 在 \(a\) 处的导数。则

\[\lim_{t\to 0} \fr {f(a + t) - f(a) - f'(a) t} t = 0, \]

即

\[f(a + t) = f(a) + f'(a)t + o(t), \ t\to 0. \]

因此 \(f\) 在 \(a\) 处可微，且 \(\DD f(a) (t) = f'(a)t\)。

参数化曲线的切向量；质点的运动速度。

线性函数的梯度

设 \(V\) 是内积空间，则 \(V\) 上任何线性函数 \(L : V\to \R\) 都可以表示为内积形式（Riesz 表示定理）

\[L(\bf x) = \an {\bf b, \bf x}, \quad \forall\bf x\in V. \]

\(\bf b\) 称为 \(L\) 的梯度。于是 \(\bf b\in (\ker L) ^ {\perp}\)，因为 \(\an {\bf b, \bf x} = L(\bf x) = 0,\ \forall \bf x\in \ker L\)，且 \(L(\bf b) = \|\bf b\| ^ 2\)。\(L\equiv 0\) 当且仅当 \(\bf b = \bf 0\)。

设 \(\bf b_1, \bf b_2 \in (\ker L) ^ {\perp}\) 且 \(L(\bf b_1) = L(\bf b_2) = 1\)，则 \(\bf b_1 - \bf b_2\) 同时属于 \(\ker L\) 和 \((\ker L) ^ \perp\)，于是 \(\bf b_1 = \bf b_2\)。这证明了梯度的唯一性。

令 \(\bf b = \fr {\bf b_1} {\|\bf b_1\| ^ 2}\)，则 \(\bf b\) 就是梯度：

考虑到 \(\|\bf b\| = \frac 1 {\| \bf b_1\|}\)，且 \(L(\bf b) = \fr 1 {\| \bf b_1 \| ^ 2} = \|\bf b\| ^ 2 = \an{\bf b, \bf b}\)。

也可考虑 \((\ker L) ^ \perp\) 方向上的单位向量 \(\hat {\bf b}\)，则 \(L(\hat {\bf b}) = \lan \bf b, \hat {\bf b} \ran = \| \bf b \|\)。

理解：考虑二元函数 \(f(x, y)\)。经过原点的平面为 \(z = ax + by\)。梯度告诉我们描述微分平面的 \(a, b\)，于是 \((\D x, \D y)\) 处微分平面的取值（方向导数）为 \(a\D x + b\D y = \an {(a, b), (\D x, \D y)}\)，与梯度的定义相对应。\(a, b\) 分别为微分平面沿 \(x\) 方向和 \(y\) 方向的上升速率，即微分点处 \(x\) 和 \(y\) 的偏导，于是 \(\na f(x_0, y_0) = \fr {\pa f}{\pa x}(x_0, y_0) \hat {\bf x} + \fr {\pa f} {\pa y}(x_0, y_0) \hat {\bf y}\)。对更高维度类似。
注意：当基底不是标准正交基时，内积不等于对应坐标相乘求和，所以非笛卡尔坐标系下的梯度公式复杂得多。推导见 205 小节梯度与偏导数部分。

\[\bpm \bf e_1 \cdot \bf e_1 & \cdots & \bf e_1 \cdot \bf e_n \\ \vdots & \ddots & \vdots \\ \bf e_n \cdot \bf e_1 & \cdots & \bf e_n \cdot \bf e_n \epm ^ {-1} \bpm L(\bf e_1) \\ \vdots \\ L(\bf e_n) \epm. \]

函数的梯度

设 \(V\) 是内积空间，\(A\subset V\) 是非空开集，\(\bf a\in A\)。对可微函数 \(f : A\to \R\)，微分 \(\dd f(\bf a)\) 的梯度称为 \(f\) 在 \(\bf a\) 处的梯度，记为 \(\gr f(\bf a)\) 或 \(\na f(\bf a)\)，即

\[\dd f(\bf a) (\bf x) = \an {\gr f(\bf a), \bf x}. \]

有 \(\gr \an {\bf x, \bf x} = 2\bf x\)（因为 \(\dd \an {\bf x, \bf x}(\bf v) = 2\an {\bf x, \bf v}\)），\(\gr \| \bf x\| = \fr {\bf x} {\| \bf x\|}\)，\(\gr \det (A) = (A ^ *) ^ T\)（因为 \(\an {A, B} = \tr(A ^ T B)\)）。

运算性质

与微分一致：线性（加减），Leibniz 公式（乘），取倒数（除）。

\[\dd \l( \fr 1 {f(x)}\r) = -\fr {\dd f(x)} {f(x) ^ 2},\quad \gr \l( \fr 1 {f(x)}\r) = -\fr {\gr f(x)} {f(x) ^ 2}. \]

小结

可微性和微分与范数无关。
一元映射的导数与范数无关。
梯度和范数有关，因为梯度依赖于内积。
导数是函数值空间的向量，梯度是自变量空间的向量，微分是抽象的映射关系，不属于函数值空间或自变量空间。WXF：物理学家更喜欢用导数和梯度而不是微分，但微分的运算比梯度容易得多。

205 方向导数与偏导数

高维空间没法求导了怎么办？把函数限制在一条直线上，这就是方向导数。

\(n\) 条坐标轴撑起了一个 \(n\) 维坐标系，把一个 \(n\) 维的点根据坐标表示转化成了一组 \(n\) 个数。在考虑 \(\R ^ n\to \R\) 的多元函数微分时，也可以用类似的方法理解，这就是偏导数。

方向导数

方向导数

设 \(A\) 是线性空间 \(V\) 中的非空开集，\(\bf a\in A\)，\(\bf v\in V\)。

映射 \(f : A\to W\) 沿过 \(\bf a\) 点的直线成为一元映射 \(g(t) = f(\bf a + t\bf v)\)，若存在极限

\[g'(0) = \lim_{t\to 0} \fr {f(\bf a + t\bf v) - f(\bf a)} {t}, \]

则记为 \(\pa_{\bf v} f(\bf a)\)，称为 \(f\) 在 \(\bf a\) 处沿向量 \(\bf v\) 的导数。当 \(\bf v\) 是单位向量时，也称 \(f\) 在 \(\bf a\) 处 沿 \(\bf v\) 的方向导数。

\(\pa_{\bf v} f(\bf a)\) 反映了函数 \(f\) 在 \(\bf v\) 方向上的增长率，但和 \(\|\bf v\|\) 有关。为比较不同方向的增长率，限定 \(\| \bf v\| = 1\)。

微分与方向导数

若 \(f\) 可微，则对任何过点 \(\bf a\) 的可微曲线 \(\gamma(t)\)，\(f(\gamma(t))\) 关于 \(t\) 可导，且由链索法则，

\[\l.\fr {\dd}{\dd t}f(\gamma(t))\r|_{t = 0} = \DD f(\bf a) \gamma'(0). \]

于是

\[\pa_{\bf v} f(\bf a) = \DD f(\bf a) \bf v. \]

当 \(f\) 可微时，\(f\) 沿每个向量 \(\bf v\) 都有导数，且关于 \(\bf v\) 线性。

注意：沿每个向量有导数不能推出 \(f\) 可微（一元函数可导当且仅当左导数等于右导数，注意左导数是方向导数的相反数）。考虑下例。

例 1

\[f(x, y) = \bc \fr {x ^ 3 + y ^ 3} {x ^ 2 + y ^ 2} , & (x, y)\neq (0, 0); \\ 0 , & (x, y) = (0, 0). \ec \]
于是

\[f(t v ^ 1, tv ^ 2) = t \fr {(v ^ 1) ^ 3 + (v ^ 2) ^ 3} {(v_1) ^ 2 + (v_2) ^ 2}, \quad \pa_{\bf v} f(0, 0) = \fr {(v ^ 1) ^ 3 + (v ^ 2) ^ 3} {(v_1) ^ 2 + (v_2) ^ 2}. \]
关于 \(v\) 不是线性，所以 \(f\) 在 \((0, 0)\) 处不可微。

注意：即使方向导数关于方向为线性，也不能推出 \(f\) 可微。考虑下例。

例 2

\[f(x, y) = \bc 1, & r \leq \t \land (x, y) \neq (0, 0); \\ 0, & r > \t \land (x, y)\neq (0, 0); \\ 0, & (x, y) = (0, 0). \ec \]
其中 \(\t\) 为 \((x, y)\) 的辐角，且当 \(\t = 0\)（\(x = 0\) 且 \(y > 0\)）时认为 \(\t = 2\pi\)。显然

\[\pa_{\bf v} f(0, 0) = 0. \]
但 \(f\) 在 \((0, 0)\) 处不可微，甚至不连续。其本质是连续对各个方向的一致性要求：无穷多个水平平台的长度都不是 \(0\)，但它们的下确界可以为 \(0\)。

由此可见可微对函数的要求很高。

如果方向导数存在且关于方向为线性，且函数连续，则函数是否可微？连续是一个很强的条件。

曲线方向

将直线 \(\bf x + t\bf v\) 改为曲线 \(\gamma (t)\)，使得对曲面上的映射 \(f\)，也可以定义

\[\pa_{\bf v}f(\bf x) = (f\circ \gamma)'(0), \]

其中曲线取弧长参数。因为沿直线方向，曲面上的函数可能没有定义。

例 3

在球极坐标系下，单位球面上的函数 \(r = r(\ph, \t)\)，其中 \(\ph\) 是经度，\(\t\) 是数学纬度，求 \(r\) 分别沿经线和纬线的方向导数。

解

沿经线移动单位弧长（因为经线的半径为 \(1\)，所以弧长即纬度变化量 \(t\)）时，

\[\l.\fr {\dd} {\dd t} r(\ph_0, \t_0 + t) \r|_{t = 0} = r_{\t}(\ph_0, \t_0). \]
沿纬线移动单位弧长（纬线的半径为 \(\sin \t_0\)，弧长为 \(\sin\t_0\D\ph\)）时，

\[\lim_{\D \ph\to 0} \fr {f(\ph_0 + \D \ph, \t_0) - f(\ph_0, \t_0)} {\sin \t_0 \cdot \D\ph} = \fr 1 {\sin\t_0} f_{\ph}(\ph_0, \t_0). \]

梯度与方向导数

若 \(f\) 为内积空间中的可微函数，则由 Cauchy-Schwarz 不等式，

\[\pa_{\bf v}f(\bf a) = \an {\gr f(\bf a), \bf v} \leq \| \mathrm{grad}\, f(\bf a)\| \| \bf v\|. \]

当且仅当 \(\bf v\) 与梯度方向一致时等号成立，于是有 梯度的极值性质：

\(f\) 沿梯度方向增长最快；\(f\) 的梯度和微分 \(\dd f(\bf a)\) 的零空间正交；
\(f\) 的最大变化率等于梯度的长度；
可微函数的等高线和梯度垂直。

偏导数

在 \(V\) 中引入坐标系 \(\bf x = (x ^ 1, x ^ 2, \cdots, x ^ m)\)，函数 \(f : A\to \R\) 成为 \(m\) 元函数。只让 \(x ^ k\) 变化，则 \(f\) 成为关于 \(x ^ k\) 的一元函数，对应导数（若极限存在）称为 \(f\) 关于 \(x ^ k\) 的 偏导数

\[f_{x ^ k}(\bf x) = \lim_{t \to 0} \fr {f(x ^ 1, x ^ 2, \cdots, x ^ k + t, \cdots, x ^ m) - f(x ^ 1, x ^ 2, \cdots, x ^ k, \cdots, x ^ m)} {t}. \]

即 \(\bf x = x ^ 1\bf e_1 + \cdots + x ^ m \bf e_m\) 沿基底向量 \(\bf e_k\) 的导数 \(\pa_{\bf e_k} f(\bf x)\)（不是方向导数，因为 \(\|\bf e_k\|\) 不一定等于 \(1\)）。

特别注意：不能将偏导数和沿基底向量的导数视为完全等价。偏导数的 \(\bf x\) 是基底向量的线性组合，其本质是坐标向量，而方向导数的 \(\bf a\) 是空间中客观的点，没有坐标。在不移动 \(\bf e_k\) 的前提下，无论如何移动基底，\(\bf a\) 的位置不变，所以 \(\bf a\) 沿 \(\bf e_k\) 的导数不变，但其它基底向量会影响 \(\bf x\) 的位置，继而改变 \(\bf x\) 沿 \(\bf e ^ k\) 的导数。

偏导数也记成

\[\pa_k f(\bf x),\ f_k(\bf x),\ \fr {\pa f} {\pa x ^ k}(\bf x),\ \pa_{x ^ k} f(\bf x). \]

也有以下形式的偏导数表达：

\[\l(\fr {\pa u} {\pa y}\r)_{x, z}, \]

它表明变量 \(u\) 是关于 \(x, y, z\) 的函数，在给定 \(x, z\) 的值时，\(u\) 关于 \(y\) 的变化率。这种表达方式尤其精确。

例 1

理想气体状态方程：\(PV = nRT\)，则

\[V\l(\fr {\pa P} {\pa V}\r)_T + T\l(\fr {\pa P} {\pa T}\r)_V = 0, \quad \l(\fr {\pa P} {\pa V}\r)_T \l(\fr {\pa V}{\pa T}\r)_P \l(\fr {\pa T} {\pa P}\r)_V = -1. \]
证明即平凡计算。

实际上，对任意满足一个三元可微代数方程约束的三个变量都有以上结论。对于更高维，结果为 \(-1\) 的维数次方（这验证了一元函数的反函数求导公式）。将在隐函数部分学习相关知识。

微分与偏导数

对可微函数 \(f\)，

\[\dd f(\bf x) \bf v = \dd f(\bf x) (\xi ^ 1\bf e_1 + \cdots + \xi ^ m \bf e_m) = \sum_{k = 1} ^ m \xi ^ k \dd f(\bf x) \bf e_k = \sum_{k = 1} ^ m \xi ^ k f_{x ^ k}(\bf x). \]

于是微分 \(\dd f(\bf x)\) 表示为由偏导数组成的行向量

\[\bpm f_{x ^ 1}(\bf x) & f_{x ^ 2}(\bf x) & \cdots & f_{x ^ m}(\bf x) \epm. \]

它作用在列向量上就是和它做点积。

梯度与偏导数

给定内积空间 \(V\) 的一组单位正交基，则对可微函数 \(f\)，

\[\an {\gr f(\bf x), \bf v} = \dd f(\bf x) \bf v = \sum_{k = 1} ^ m \xi ^ k f_{x ^ k}(\bf x). \]

注意：上式成立不需要单位正交基。第一个等号是梯度的定义，第二个等式是微分和偏导数的关系。但是从上式推出梯度的坐标表示需要单位正交基。只有在单位正交基下 \(\an{\bf u, \bf v} = \sum_{k = 1} ^ m u ^ iv ^ i\)。

于是梯度 \(\gr f(\bf x)\) 在 笛卡尔坐标系 下表示为由偏导数组成的列向量

\[\bpm f_{x ^ 1}(\bf x) \\ f_{x ^ 2}(\bf x) \\ \vdots \\ f_{x ^ m}(\bf x) \epm. \]

由此可见微分是一个更好的概念：它与坐标系的选取无关，但 梯度受到坐标系的影响。

一般坐标系下梯度的坐标表示

对可微函数 \(f\)，设 \(\gr f(\bf x) = c ^ 1 \bf e_1 + \cdots + c ^ m \bf e_m\)，则由梯度的定义，

\[f_{x ^ j}(\bf x) = \an {\gr f(\bf x), \bf e_j} = \sum_{i = 1} ^ m \an {\bf e_j, \bf e_i} c ^ i = ((g_{i, j})\bf c)_j, \]

其中 \(G = (g_{i, j}) = (\an {\bf e_i, \bf e_j})\) 称为 度量矩阵。于是梯度为列向量

\[G ^ {-1} \bpm f_{x ^ 1}(\bf x) \\ f_{x ^ 2}(\bf x) \\ \vdots \\ f_{x ^ m}(\bf x) \epm = G ^ {-1} \bpm \dd f(\bf x) \bf e_1 \\ \dd f(\bf x)\bf e_2 \\ \vdots \\ \dd f(\bf x) \bf e_m \epm. \]

一阶微分的形式不变性

考虑二元函数 \(f(x, y)\)。坐标函数 \((x, y)\mps x\) 和 \((x, y)\mps y\) 都是线性可微函数。用函数值表示函数，则这两个函数分别记为 \(x, y\)。因为线性函数的微分是自身，所以对 \(\bf v = \xi \bf e_1 + \eta \bf e_2\)，

\[\dd x(\bf v) = \xi, \quad \dd y(\bf v) = \eta. \]

由微分与偏导数的关系，

\[\dd f(x, y)(\bf v) = f_x(x, y) \xi + f_y(x, y)\eta = f_x(x, y)\dd x(\bf v) + f_y(x, y)\dd y(\bf v). \]

于是

\[\dd f = f_x \dd x + f_y \dd y. \]

这是线性函数之间的关系。

在任何坐标系下，对可微函数 \(f\) 都有

\[\dd f = \sum_{k = 1} ^ m f_{x ^ k} \dd x ^ k. \]

传统称 \(\dd f\) 为全微分，称 \(\dd x ^ k\) 为偏微分（偏的本意是部分，partial）。偏导数就是偏微分的系数。

以上结果在任意坐标系下成立。

极坐标系下的偏导数和梯度

用 \([,]\) 表示极坐标，则 \(\bf x = [r, \t] = (r\cos \t, r\sin \t)\)。

\[\bf e_r = \pa_{r} \bf x = (\cos \t, \sin \t),\quad \bf e_{\t} = \pa_{\t}\bf x = (-r\sin \t, r\cos \t) \]

是 \(\bf x\) 处的一对向量，给出了极坐标系的一组基底，满足

\[\an {\bf e_r, \bf e_r} = 1,\quad \an {\bf e_r, \bf e_{\t}} = 0,\quad \an {\bf e_{\t}, \bf e_{\t}} = r ^ 2. \]

\(\bf e_r\) 和 \(\bf e_{\t}\) 分别描述了在极坐标系下 \(r\) 和 \(\t\) 以单位速度增加时，坐标在笛卡尔系下的变化情况。

试推导梯度的坐标表示。设

\[\gr f(\bf x) = [c ^ 1, c ^ 2] = c ^ 1\bf e_r + c ^ 2 \bf e_{\t} = (c ^ 1\cos \t - c ^ 2r\sin \t, c ^ 1\sin \t + c ^ 2 r\cos \t),. \]

由梯度与微分的关系和微分与偏导的关系，由

\[f_r(\bf x) = \dd f(\bf x) \bf e_r = \an {\gr f(\bf x), \bf e_r} = c ^ 1, \quad f_{\t}(\bf x) = \an {\gr f(\bf x), \bf e_{\t}} = c ^ 2r ^ 2 \]

得到

\[\gr f(\bf x) = [c ^ 1, c ^ 2] = \l[f_r, \fr 1 {r ^ 2}f_{\t}\r] = f_r\bf e_r + \fr 1 {r ^ 2} f_{\t} \bf e_{\t} = \l(f_r\cos \t - \fr {f_{\t}} r\sin \t, f_r\sin \t + \fr {f_{\t}} r \cos \t\r). \]

这是用极坐标系下的偏导数表示极坐标系下的梯度的方式。

由

\[\gr f(\bf x) = (f_x, f_y) \]

解得

\[\bal f_r & = f_x \cos \t + f_y \sin \t = \fr {xf_x + yf_y} {\sqrt {x ^ 2 + y ^ 2}}, \\ f_\t & = r f_y\cos \t - rf_x \sin \t = xf_y - yf_x. \eal \]

这是用笛卡尔坐标系下的偏导数表示极坐标系下的偏导数的方式。接下来会介绍更优秀的方式，链索法则，见 Jacobi 矩阵小节的例 2。可见固定 \((x, y)\) 时 \(f_r, f_\t\) 为 \(f_x, f_y\) 的线性组合（偏导数可以是向量），但 \(f_r, f_\t\) 关于 \(x, y\) 显然不是线性。这说明不同坐标系下的偏导数相差一个线性变换，变换与求导位置有关，关于求导位置不是线性（笛卡尔坐标到极坐标的变换不是线性）。

同时有

\[\dd f = f_x\dd x + f_y\dd y = f_x (\cos \t\dd r - r\sin \t \dd \t) + f_y(\sin \t \dd r + r\cos \t \dd \t) = f_r \dd r + f_{\t} \dd \t. \]

这进一步验证了一阶微分的形式不变性。

偏导数的优缺点

优点：

便于计算；
尽可能利用一元微积分的方法和结论；
符合传统 “变量-变量” 的函数观点。

缺点：

记号容易混淆：无法区分中间变量和独立变量，也无法明确变量是否受隐函数控制；
只反映部分信息，和坐标系有关。

可偏导是最弱的性质，偏导数所蕴含的信息不完整，仅反映了自变量沿平行于坐标轴方向移动时函数的变化情况；可微是最强的性质，微分蕴含了整体信息，反映了自变量任意移动时函数的变化，不依赖于坐标系。但如果可微，则抽象的微分的计算可以转化为具体的偏导数的计算。介绍一个重要的，由偏导数推出可微的条件。

对二元函数，在开集 \(U\) 中，若 \(\fr {\pa f} {\pa x}, \fr {\pa f} {\pa y}\) 到处存在且连续，则 \(f\) 在 \(P\in U\) 上可微。

证明

从微分的定义入手。

对 \(P_0 = (x_0, y_0)\)，\(\forall P = (x, y)\in U\)，

\[f(x, y) - f(x_0, y_0) - f_x(P_0)(x - x_0) - f_y(P_0)(y - y_0) \]
应当等于 \(o(\| P - P_0\|)\)。

令 \(Q = (x, y_0)\)，则当 \(P_0\to P\) 时，\(Q\to P\)，

\[\bal f(P) - f(P_0) & = f(P) - f(Q) + f(Q) - f(P_0) \\ & = f_y(x, \xi)(y - y_0) + (f_x(P_0)(x - x_0) + o(x - x_0)) \\ & = (f_y(P_0) + o(1)) (y - y_0) + (f_x(P_0) + o(1))(x - x_0) \\ & = f_y(P_0)(y - y_0) + f_x(P_0)(x - x_0) + o(\| P - P_0 \|). \eal \]

对于多元函数类似。注意到证明只用到一个维度的偏导函数连续，可知对 \(m\) 元函数，若 \(m - 1\) 个偏导函数在邻域内连续，则剩下一个偏导函数存在即可推出函数在该点可微。

偏导函数连续则可微，可微则偏导函数不一定连续。
可微则连续且偏导数存在，连续或偏导数存在则不一定可微。

Jacobi 矩阵

尝试将函数的偏导数推广至映射的偏导数。

映射 \(A\to W\) 在 \(\bf x\in A\) 处可微。在 \(V, W\) 的坐标系 \((x ^ 1, \cdots, x ^ m)\) 和 \((y ^ 1, \cdots, y ^ n)\)，\(\bf y = f(\bf x)\) 写成一组函数

\[y ^ i = f ^ i(x ^ 1, \cdots, x ^ m), \]

则 \(f\) 在 \(\bf x\) 处可微当且仅当这些函数在 \(\bf x\) 处可微。于是 \(f\) 的微分 \(\DD f(\bf x)\) 可通过这些函数的微分表示为矩阵

\[Jf(\bf x) = \l(\fr {\pa f ^ i} {\pa x ^ j}(\bf x)\r)_{n\times m} = \bpm \fr {\pa y ^ 1} {\pa x ^ 1} & \cdots & \fr {\pa y ^ 1} {\pa x ^ m} \\ \vdots & \ddots & \vdots \\ \fr {\pa y ^ n} {\pa x ^ 1} & \cdots & \fr {\pa y ^ n} {\pa x ^ m} \epm, \]

称为 \(f\) 在 \(\bf x\) 处的 Jacobi 矩阵。其行列式称为 Jacobi 行列式或 Jacobian。

注意 \(y\) 决定了每一行而 \(x\) 决定了每一列，这是因为微分对应的线性函数作用在出发空间的向量上，即矩阵右侧乘以出发空间的 \(m\) 维列向量，得到像空间的 \(n\) 维列向量，每个维度的结果由矩阵的一行乘以右侧列向量得到。另一种理解方式是当 \(W = \R\) 时微分是行向量。

链索法则

\[J(g\circ f)(\bf x) = Jg(f(\bf x)) \times J f(\bf x). \]

复合映射的 Jacobi 矩阵是每个映射的 Jacobi 矩阵的乘积。

例 1

求 \(z = f(x, \fr {y} {x ^ 2})\) 的偏导数。

解

设 \(u = x\)，\(v = \fr {y} {x ^ 2}\)，则 \(z = f(u, v)\)。由链索法则，

\[\bal & z_x = z_u u_x + z_v v_x = f_1(u, v) \cdot 1 - f_2(u, v) \cdot \fr {2y} {x ^ 3}, \\ & z_y = z_uu_y + z_vv_y = f_1(u, v) \cdot 0 + f_2(u, v) \fr 1 {x ^ 2}. \eal \]
将 \(x, y\) 带入 \(u, v\) 即得最终结果。

引入中间变量，画出变量树，则最终变量关于独立变量的偏导数等于对应路径的偏导乘积之和。

也可以用 Jacobi 矩阵计算，本质相同。

例 2

求二元函数 \(u = u(x, y)\) 在直角坐标系和极坐标系下偏导数的关系。

解

根据链索法则

\[\fr {\pa u} {\pa (r, \t)} = \fr {\pa u} {\pa(x, y)} \fr {\pa(x, y)} {\pa (r, \t)} \]
简单计算即可。

求 Jacobi 矩阵的逆矩阵即可得到另一个方向的关系。

一阶微分的形式不变性

对可微函数 \(z = g(\bf y)\) 以及可微映射 \(\bf y = f(\bf x)\)，

\[\sum_{j} \fr {\pa z} {\pa x ^ j} \dd x ^ j = \sum_{j} \sum_{k} \fr {\pa z} {\pa y ^ k} \fr {\pa y ^ k} {\pa x ^ j} \dd x ^ j = \sum_{k} \fr {\pa z} {\pa y ^ k} \sum_{j} \fr {\pa y ^ k} {\pa x ^ j} \dd x ^ j = \sum_{k} \fr {\pa z} {\pa y ^ k} \dd y ^ k. \]

其中 \(f\) 是空间中的坐标系变换。

链索法则和形式不变性的本质：一阶微分是与坐标系选择无关的几何概念。

于是例 \(1\) 也可以使用形式不变性的方法解决，本质没有区别。

例 3

求 \(z = z(x, y)\) 使得 \(\dd z = (\e ^ y + \sin x) \dd x + (x\e ^ y\cos y)\dd y\)。

解

考虑到 \(\sin x \dd x = \dd(-\cos x)\)，\(\cos y\dd y = \dd \sin y\)，而

\[\e ^ y \dd x + x\e ^ y\dd y = \e ^ y\dd x + x\dd \e ^ y = \dd (x\e ^ y), \]
于是 \(z(x, y) = (x\e ^ y - \cos x - \sin y) + C\)。

注意需证明 \(\dd f = 0\) 的函数是常值函数：取任意可微曲线用 Lagrange 中值定理说明。

由微积分基本定理，对于一元函数，任意连续函数 \(f\) 都有原函数 \(F\) 满足 \(\dd F = f(x)\dd x\)，即所有连续系数的微分形式都是全微分。对于多元函数是否仍有这样的结论？

例 4

求 \(z = z(x, y)\) 满足 \(\dd z = y\dd x - x\dd y\)。

解

假设 \(z\) 存在，则

\[\fr {\dd} {\dd \t} z(\cos \t, \sin \t) = -z_x\sin \t + z_y\cos\t = -y\sin \t - x\cos \t = -\sin ^ 2\t - \cos ^ 2 \t = -1. \]
于是 \(0 = z(1, 0) - z(1, 0) = z[1, 2\pi] - z[1, 0] = 2\pi\)，矛盾。可知 \(z\) 不存在。

对于多元函数，一阶微分形式不一定是一阶微分。

206 偏导数与高阶导数

偏导数的连续性是很强的条件，甚至可以反推出可微。一致连续性的条件可以推出很多极限换序的性质，于是偏导数的一致连续性带来了含参积分的可微性（是一个很巧妙的求解积分的手段），本质上是积分与求导换序。此外还有累次积分换序。

和一元微积分一样，多次求导得到高阶偏导数是进行多元函数 Taylor 展开的前置条件。Clairaut 定理告诉我们如果任意顺序求导得到的高阶偏导函数连续，那么结果和求导顺序无关，是很好用的定理。

还有一些神秘的求解偏微分方程的技巧，比如特征线法和分离变量法。

偏导数与可微性

可微推出一阶偏导数存在，但所有一阶偏导数存在不能推出可微，甚至不一定连续。

若 \(f\) 在 \(\bf {a}\) 处所有一阶偏导数都存在，且其中至少 \(m - 1\) 个一阶偏导函数在 \(\bf a\) 的邻域中连续，并在 \(\bf a\) 处连续，则 \(f\) 在 \(\bf a\) 处可微。

证明见 205 章偏导数小节的最后部分。核心思想是根据自变量只能沿一个维度移动得到折线，在每一条折线上使用微分中值定理，并在以 \(\bf a\) 为一端的折线上直接 Taylor 展开。

\(\scr C ^ k\) 类函数

若 \(f\) 在 \(A\) 的每个点处都存在所有一阶偏导数，且所有一阶偏导函数都连续，则记 \(f\in \scr C ^ 1(A)\)。

若 \(f\) 在 \(A\) 的每个点处都存在所有一阶偏导数，且所有一阶偏导函数都是 \(\scr C ^ {k - 1}\) 类的，则记 \(f\in \scr C ^ k(A)\)。\(f\in \scr C ^ {\infty}(A)\) 表示对任意 \(k\in \N ^ *\)，\(f\in \scr C ^ k(A)\)。

线性函数和多重线性映射是 \(\scr C ^ {\infty}\) 的；
\(\scr C ^ k\) 映射的复合是 \(\scr C ^ k\) 的（利用链索法则归纳）；
矩阵求逆是 \(\scr C ^ {\infty}\) 的。

偏导数与连续性

若 \(m\) 元函数 \(f\) 关于一个自变量在 \(\bf a\) 处连续，关于其它自变量在 \(\bf a\) 的邻域内存在有界偏导函数，则 \(f\) 在 \(a\) 处连续。证明是类似的。

注意：二元连续不是固定 \(x\) 关于 \(y\) 连续且固定 \(y\) 关于 \(x\) 连续。

高阶偏导数

高阶偏导数就是偏导函数的导函数。

记

\[f_{k_1, \cdots, k_r} = \fr {\pa} {\pa x ^ {k_r}} \cdots \fr {\pa} {\pa x ^ {k_1}} f = \fr {\pa ^ r f} {\pa x ^ {k_r} \cdots \pa x ^ {k_1}}. \]

这个符号记录了每次求导的变量以及求导顺序。

Clairaut 定理：若对任意排列 \(\sigma\)，偏导数 \(f_{k_{\sigma(1)}, \cdots, k_{\sigma(r)}}\) 都是连续函数，则它们的值相等，即 求导与顺序无关。于是有记号

\[f ^ {(\a_1, \cdots, \a_{m})} = \l(\fr {\pa} {\pa x ^ m}\r) ^ {\a_m} \cdots \l(\fr {\pa} {\pa x ^ 1}\r) ^ {\a_1} f. \]

对于 \(u_{21}(x, y)\)，写出其极限展开式，使用 Lagrange 微分中值定理并利用 \(u_{12}\) 的连续性可证其等于 \(u_{12}(x, y)\)。于是可归纳证明该定理。

例 1

求一维波动方程 \(u_{tt} - u_{xx} = 0\)（弦振动）的 \(\scr C ^ 2\) 解。

解

\[\l(\fr {\pa} {\pa t} - \fr {\pa} {\pa x}\r) \l(\fr {\pa} {\pa t} + \fr {\pa} {\pa x}\r) u = 0 \]
等价于

\[\bc \l(\fr {\pa} {\pa t} + \fr {\pa} {\pa x}\r) u = v, \\ \l(\fr {\pa} {\pa t} - \fr {\pa} {\pa x}\r) v = 0. \ec \]
因为

\[\bal \fr {\dd} {\dd t}v(t, -t + C) & = v_1(t, -t + C) \fr {\dd t} {\dd t} + v_2(y, -t + C) \fr {\dd (-t + C)} {\dd t}\\ & = v_1(t, -t + C) - v_2(t, -t + C) \\ & = 0, \eal \]
所以 \(v\) 沿直线 \(x = -t + C\) 为常值 \(v(0, C)\)，称为微分方程的 特征线。于是 \(v(t, x) = v(0, x + t)\)，可知任何 \(\scr C ^ 1\) 函数 \(v(t, x) = f(x + t)\) 都是 \(v_t - v_x = 0\) 的解。找特征线是解一阶线性偏微分方程的基本方法。

因为线性方程的解可以被表示为任意非齐次方程特解加上齐次方程通解，对 \(u_t + u_x = v\)，解 \(u_t + u_x = 0\) 得到 \(u(t, x) = g(x - t),\ g\in \scr C ^ 1\)。

考虑 \(u_t + u_x = f(x + t)\)，沿特征线 \(x = t + C\) 有

\[\fr {\dd} {\dd t} u(t, t + C) = u_1(t, t + C) + u_2(t, t + C) = v(t, t + C) = f(2t + C). \]
根据微积分基本定理，

\[u(t, t + C) = u(0, C) + \int_{0} ^ t f(2s + C)\dd s. \]
因此

\[u(t, x) = u(0, x - t) + \int_0 ^ {t} f(2s + (x - t)) \dd s = F(x - t) + \fr 1 2\int_{x - t} ^ {x + t} f(s)\dd s = F(x - t) + G(x + t). \]
对任何 \(\scr C ^ 2\) 函数 \(F, G\)，

\[u(t, x) = F(x - t) + G(x + t). \]
是波动方程的解，两个传播方向相反的行波之和。

若加入边界条件 \(u(t, 0) = u(t, L) = 0\)（弦的两端始终固定），则

\[F(-t) + G(t) = 0,\quad F(L - t) + G(L + t) = 0. \]
于是

\[G(L + t) = -F(L - t) = G(t - L). \]
可知 \(G\) 是以 \(2L\) 为周期的周期函数，且

\[u(t, x) = G(x + t) + F(x - t) = G(x + t) - G(t - x). \]

以上求得波动方程的行波解。

例 2

求波动方程 \(u_{tt} - u_{xx} = 0\) 的 \(\scr C ^ 2\) 分离变量形式 \(u(t, x) = U(t)V(x)\) 的解。

解

由方程可知

\[V''(t)U(x) = V(t)U''(x)\implies \fr {V''(t)} {V(t)} = \fr {U''(x)} {U(x)} = \la. \]
解 \(V'' - \la V = 0\)。当 \(\la\geq 0\) 时无界（当 \(\la > 0\) 解为指数函数，当 \(\la = 0\) 解为一次函数），令 \(\la = -\omega ^ 2\) 得

\[V(t) = A_1\cos (\omega t) + A_2\sin (\omega t). \]
于是

\[u(t, x) = (A_1\cos(\omega t) + A_2\sin(\omega t))(B_1\cos (\omega x) + B_2\sin (\omega x)). \]
由辅助角公式与和差化积公式，

\[u(t, x) = K_1 \cos(\omega(x + t) + \t_1) + K_2(\omega(x - t) + \t_2). \]

以上求得波动方程的驻波解。

因为 \(U(\fr {2k\pi} {\omega}) = 0\)，所以对任意 \(t\)，\(u(t, \fr {2k\pi} {\omega}) = 0\)。

例 3

Laplace 算子：\(\D u = u_{xx} + u_{yy}\)。求平面极坐标系下 Laplace 算子的形式。

解

由链索法则，

\[(\pa_x, \pa_y) = (\pa_r, \pa_{\t}) \l(\fr {\pa(x, y)} {\pa(r, \t)}\r) ^ {-1} = (\pa_r, \pa_{\t}) \bpm \cos \t & \sin \t \\ -\fr 1 r\sin \t & \fr 1 r \cos \t \epm. \]
因此

\[\pa_x = \cos \t \pa_r - \fr 1 r \sin \t \pa_\t,\quad \pa_y = \sin \t \pa_r + \fr 1 r \cos \t \pa_t. \]
于是

\[u_{xx} = \l(\cos \t\pa_r - \fr 1 r \sin \t \pa_\t\r) ^ 2u = \cdots = \cos ^ 2\t u_{rr} - \fr {2\sin \t \cos \t} {r} u_{r\t} + \fr {\sin ^ 2 \t} {r ^ 2} u_{\t\t} + \fr {\sin ^ 2\t} {r} u_r + \fr {2\sin \t\cos \t} {r ^ 2} u_{\t}. \]
注意 \(u_r, u_\t\) 同时和 \(r, \t\) 有关，计算过程中需要使用 Leibiniz 公式，如 \(\pa_r (-\fr 1 r\sin \t u_{\t}) = \fr {\sin \t\cos \t} {r ^ 2}u_{\t} - \fr {\sin \t \cos \t} {r} u_{r\t}\)。

根据对称性，当 \(x\to y\) 时，\(\t \to \fr \pi 2 - \t\)，\(\sin \t \to \cos \t\)，\(\cos \t \to \sin \t\)，\(\pa_\t \to -\pa_\t\)。

可知

\[u_{yy} = \sin ^ 2\t u_{rr} + \fr {2\cos \t \sin \t} {r} u_{r\t} + \fr {\cos ^ 2 \t} {r ^ 2} u_{\t\t} + \fr {\cos ^ 2\t} {r} u_r - \fr {2\cos \t \sin \t} {r ^ 2} u_{\t}. \]
于是

\[\D u = u_{rr} + \fr 1 {r ^ 2} u_{\t\t} + \fr 1 r u_r. \]

使用分离变量法解 \(\D u = 0\)，得到

\[r ^ 2U''(r) + rU'(r) - \la U(r) = 0,\quad V''(\t) + \la V(\t) = 0. \]

其中第一个方程为 Euler 方程。因为 \(V\) 以 \(2\pi\) 为周期，所以 \(\la = k ^ 2\)，其中 \(k\) 是非负整数。

当 \(k = 0\) 时，\(V(\t) = V_0\)，\(U(r) = U_0 + U_1\ln r\)；
当 \(k\) 为正整数时，\(V(\t) = V_1\cos k\t + V_2\sin k\t\)，\(U(r) = U_1r ^ k + \fr {U_2} {r ^ k}\)。

含参积分

含参积分对参数的可微性

讨论 \(g(x, y) = \int_{a} ^ b f(x, y, z)\dd z\) 的连续可微性。连续性在 201 章节已经讨论过。

现在我们猜测

\[g_x(x, y) = \int_a ^ b f_x(x, y, z)\dd z, \]

即

\[\fr {\pa} {\pa x} \int_a ^ b f(x, y, z) \dd z = \int_a ^ b \fr {\pa } {\pa x} f(x, y, z)\dd z. \]

根据微分定义，检验

\[\bal & \; \abs {g(x + h, y) - g(x, y) - h\int_{a} ^ b f_x(x, y, z)\dd z} \\ = &\; \abs {\int_{a} ^ b (f(x + h, y, z) - f(x, y, z) - hf_x(x, y, z)) \dd z} \\ = &\; \abs {\int_{a} ^ b \int_{0} ^ h (f_x(x + t, y, z) - f_x(x, y, z)) \dd t \dd z} \\ \leq & \; |\eps(b - a) h|, \quad \forall |h| < \delta_\eps \eal \]

注意 \(\delta_\eps\) 不能依赖于外层积分连续变化的 \(z\)，即

\[\forall \eps > 0,\ \exists \delta_{\eps} > 0: \forall |h| < \delta_\eps,\ {\color {red}\forall z\in [a, b]},\ |f(x + h, y, z) - f(x, y, z)| < \eps. \]

\(f_x\) 关于 \(x\) 的连续性对 \(z\) 一致：含参积分不可能绕过一致连续。

有界闭区间上的连续推出一致连续，于是若 \(f, f_x, f_y\in \scr C([\a, \b] \times [\la, \mu] \times [a, b])\)，则

\[g_x(x, y) = \int_a ^ b f_x(x, y, z)\dd z, \quad g_y(x, y) = \int_a ^ b f_y(x, y, z) \dd z. \]

连续，推出 \(g\in \scr C ^ 1 ([\a, \b]\times [\la, \mu])\)。

进一步地，若 \(f, f_x, f_y\in \scr C ^ r([\a, \b] \times [\la, \mu] \times [a, b])\)，则 \(g\in \scr C ^ r ([\a, \b]\times [\la, \mu])\)，且

\[\fr {\pa ^ k} {\pa x ^ i\pa y ^ j} \int_a ^ b f(x, y, z)\dd z = \int_a ^ b \fr {\pa ^ k} {\pa x ^ i\pa y ^ j} f(x, y, z) \dd z,\quad i + j = k \leq r. \]

黄皮教材对应定理 2.2.2 证明错误：\(\t\) 同时和 \(x, y, \D y\) 有关，不能保证 \(f(x, y + \t \D y)\) 的连续性，自然无法使用定理 2.2.1。

例 1

设 \(u, v, f\in \scr C ^ 1\)，\(F(y) = \int_{u(y)} ^ {v(y)} f(x, y) \dd x\)，求 \(F'(y)\)。

解

记 \(G(u, v, y) = \int_{u} ^ v f(x, y)\dd x\)，可知 \(G\in \scr C ^ 1\)，于是 \(F \in \scr C ^ 1\)。由链索法则，

\[F'(y) = -f(u(y), y)u'_y + f(v(y), y) v'_y + \int_{u(y)} ^ {v(y)} f_y(x, y)\dd x. \]

例 2

讨论

\[F(x) = \bc \fr {\e ^ x - 1} {x}, & x \neq 0; \\ 1, & x = 0 \ec \]
的可微性。

解

\[F(x) = \fr 1 x \int_0 ^ {x} \e ^ t\dd t = \int_0 ^ 1 \e ^ {xs}\dd s. \]
对 \(x = 0\) 成立。\(f(t, x) = \e ^ {xt}\) 是 \(\scr C ^ {\infty}\) 函数，所以 \(F(x)\) 是 \(\scr C ^ {\infty}\) 函数。

例 3

求

\[\int_0 ^ 1 \fr {x ^ b - x ^ a} {\ln x} \dd x. \quad (a, b > 0) \]
解

考虑到 \((x ^ a)'_a = x ^ a\ln x\)，记

\[f(x, t) = \int_a ^ t x ^ s\dd s,\quad F(t) = \int_0 ^ 1 \fr {x ^ t - x ^ a} {\ln x} \dd x. \]
则 \(f, f_t(x, t) = x ^ t\) 在 \([0, 1]\times [a, b]\) 上连续，于是 \(F\) 可微，且

\[F'(t) = \int_0 ^ 1 x ^ t\dd x = \fr 1 {t + 1}. \]
因此

\[F(b) = F(a) + \int_a ^ b F'(t) \dd t = \ln(1 + b) - \ln(1 + a). \]

方法核心：将一个不易计算的积分嵌入一类积分，通过对参数求导数得到积分之间的关系，转化为容易计算的问题。

累次积分换序

设 \(f\in\scr C([a, b] \times [\a, \b])\)，则

\[\int_a ^ b \int_\a ^ \b f(x, y)\dd y \dd x = \int_\a ^ \b \int_a ^ b f(x, y) \dd x\dd y. \]

记

\[F(u) = \int_a ^ u \int_\a ^ \b f(x, y)\dd y \dd x - \int_\a ^ \b \int_a ^ u f(x, y) \dd x\dd y, \]

则 \(F(a) = 0\) 且

\[F'(u) = \int_\a ^ \b f(u, y)\dd y - \int_\a ^ \b \l(\int_a ^ u f(x, y) \dd x\r)'_u\dd y = 0. \]

常用手法：将积分等式的积分线作为变量，通过求导证明积分恒等式。

于是

\[\int_0 ^ 1 \fr {x ^ b - x ^ a} {\ln x} \dd x = \int_0 ^ 1\int_a ^ b x ^ t\dd t\dd x = \int_a ^ b \int_0 ^ 1 x ^ t\dd x \dd t = \int_a ^ b \fr 1 {t + 1} \dd t = \ln \fr {b + 1} {a + 1}. \]

直接对 \(x\) 积分转化为先对 \(b\) 求导，再对 \(x\) 积分，最后对 \(b\) 积分。这是含参积分提供的一元微积分所不具备的新的积分方法。

posted @ 2025-05-09 19:39 qAlex_Weiq 阅读(368) 评论(1) 收藏举报

刷新页面返回顶部

qAlex_Weiq