【微积分】 05 - 多元微分

1. 多元函数

1.1 欧几里得空间

　　很多函数的自变量不止一个，现在就来讨论这种函数的性质，多元函数可以记作\(f(x_1,\cdots,x_n)\)。如果只是独立地讨论函数与每个变量的关系，大可不必给出新的概念，我们需要把所有自变量当成一个“数”看待，并研究这种函数的分析特性。对于这种数，我们还需要“距离”、“长度”的概念，线性代数中提到的欧几里得空间正好符合要求，请复习相关内容。

　　为简单起见，这里默认在标准正交基下讨论，并用直接向量坐标代表向量本身（一般说成点），这也更符合使用习惯。但要注意，这里的结论对任何欧几里得空间、以及任何一组正交基都是成立的。具体来说，向量写成\(\vec{x}=(x_1,\cdots,x_n)\)，向量的距离定义为式（1），向量的长度（范数）记为\(\left\|\vec{x}\right\|\)，空间记作\(\Bbb{R}^n\)。所有满足\(\rho(\vec{x},\vec{x}_0)<\delta\)的点称为开球，而所有满足\(|x_i-x_{0i}|<\delta\)的点称为开正方体，它们都可以作为\(\vec{x}_0\)的\(\delta\)-邻域的概念，且使用起来是等价的。

\[\rho(\vec{x},\vec{y})=\sqrt{(x_1-y_1)^2+\cdots+(x_n-y_n)^2}\tag{1}\]

　　为描述方便，我们需要定义一些关于点集\(S\)概念。如果\(\vec{x}_0\)的某个领域被包含在\(S\)中，\(\vec{x}_0\)称为\(S\)的内点，领域与\(S\)无交集的叫外点，其它的叫边界点。任何点都是这三者之一，其中内点必定属于\(S\)，外点必定不属于\(S\)，边界点两种都有可能。去心领域与\(S\)总有交集的点叫聚点，否则叫孤立点，聚点可能是内点，也可能是非孤立的边界点。如果\(S\)的每一点都是内点，\(S\)被称为开集，开集的补集称为闭集，其实闭集等价于包含所有聚点的集合。相对于区间的概念，如果\(S\)中任何两个点可连通（通过自身的点相连），它被称为区域，自然还可定义开区域和闭区域。

　　一元函数的分析学性质都依赖实数的完备性，所以需要验证向量是否有类似的性质。首先容易定义柯西点列（基本点列），然后再定义极限\(\vec{x}_n\to\vec{x}_0\)，并证明极限存在的充要条件是柯西点列。极限存在则必定唯一，以上聚点就是一种极限点。可以证明极限存在等价于在每一维有极限，完备性的证明都利用了在一维的性质，故这里不再详细证明。完备性相关定义有：闭集套、开覆盖、紧集有界点集（列），相应地定理有：闭集套定理、有限覆盖定理、子列收敛定理，证明从略。

1.2 多元函数的连续性

　　类似于一元函数，我们要讨论多元函数的连续性、可微性。讨论中可以以二元函数作为直观例子，并记之为\(z=f(x,y)\)，它们容易扩展到更高维。连续性首先要定义函数极限，即当\((x,y)\to(a,b)\)时，\(f(x,y)\)存在极限\(z_0\)，记作\(f(x,y)\to z_0\)，当然也可以用\(\epsilon\)-\(\delta\)语言定义。但要注意，函数极限是一个有聚点的点集的性质，不能以某条线路作为极限的依据，当然也不能逐维求极限。为此我们把极限（2）式后两个称为累次极限，而第一个称为重极限。

\[\lim\limits_{x\to a,\,y\to b}{f(x,y)}\:\ne\:\lim\limits_{x\to a}{\lim\limits_{y\to b}{f(x,y)}}\:\ne\:\lim\limits_{y\to b}{\lim\limits_{x\to a}{f(x,y)}}\tag{2}\]

　　累次极限和重极限在特定情况下是相同的，但很多时候它们没有什么关系，你可以借助二元的函数的直观图形论证（点\((0,0)\)）。两个累次极限不一定相等（\(\dfrac{x-y+x^2+y^2}{x+y}\)），甚至其中一个没有极限（\(x\sin{\dfrac{1}{x}}\)）。累次极限存在且相等，重极限也不一定存在（\(\dfrac{xy}{x^2+y^2}\)），反之重极限存在，累次极限也不一定存在（\(x\sin{\dfrac{1}{x}}\)）。但可以证明，如果重极限\(A\)存在或为无穷，且\(y\ne b\)时\(\lim\limits_{x\to a}{f(x,y)}\)存在极限\(\varphi(y)\)，则对应的累次极限也存在且与重积分相同（式（3））。

\[\lim\limits_{x\to a,\,y\to b}{f(x,y)}=A\:\wedge\:\lim\limits_{x\to a}{f(x,y)}=\varphi(y),\:(y\ne b)\quad\Rightarrow\quad\lim\limits_{y\to b}{\lim\limits_{x\to a}{f(x,y)}}=A \tag{3}\]

　　有了极限的概念，自然可以给出连续的定义，当\((x,y)\to(a,b)\)时若\(f(x,y)\to f(a,b)\)，称\(f(x,y)\)在\((a,b)\)连续。处处连续的函数称为连续函数，可以证明连续函数的组合函数还是连续的。容易证明，函数在连续点的足够小邻域内有界，如果\(f(a,b)>0(<0)\)，则在\((a,b)\)足够小邻域内也有\(f(x,y)>0(<0)\)。

　　多元连续函数有着与一元连续函数类似的性质，证明也类似，这里仅作陈列。（1）零点定理：如果函数在区域的某两点异号，则必存在值为零的点；（2）介值定理：区域中存在两点间任意值的点；（3）有界性定理：有界闭集上的连续函数有界；（4）最值定理：有界闭集上的连续函数有最大值和最小值。多元函数也可以定义一致连续，并且同样有结论：有界闭集上的连续函数一致连续。

2. 多元微分

2.1 全微分和偏微分

　　连续性之后自然是研究可微性，它表示某点相对于领域的平滑性。首先我们当然也可以为每一维定义微分（导数），但它并不是相对于邻域的性质，为了区别开来，将某一维（比如\(x\)）的导数称为偏导数，记作\(\dfrac{\partial f}{\partial x}(x,y),\,f'_x(x,y)\)或\(f_x(x,y)\)。偏导数仅表示函数在每一维的变化趋势（切线），它不能表示函数在该点的平滑性，所谓平滑其实就是说在局部近似一个平面（二元函数），而要确定这个平面我们需要两条直线。

　　为此，自然可以想到按如下方法定义微分，设函数\(z=f(x,y)\)在区域内点\((x_0,y_0)\)满足式（4），称函数在\((x_0,y_0)\)处可微。其实容易证明，定义中的\(o(\rho)\)可以替换为\(o(\varDelta x)+o(\varDelta y)\)。显然可微函数在\((x_0,y_0)\)处存在偏导数，且满足\(f'_x(x_0,y_0)=A,f'_y(x_0,y_0)=B\)。但偏导数存在并不表示可微（\(\sqrt{|xy|}\)），甚至都不一定连续。考察式（5）对\(\varDelta z\)的变形，如果\(f'_x,f'_y\)在\((x_0,y_0)\)的一个领域内都存在且在\((x_0,y_0)\)连续，利用微分中值定理容易证明\(f(x,y)\)可微。

\[\varDelta z=A\varDelta x+B\varDelta y+o(\rho),\quad(\rho=\sqrt{(\varDelta x)^2+(\varDelta y)^2})\tag{4}\]

\[\varDelta z=[f(x_0+\varDelta x,y_0+\varDelta y)-f(x_0,y_0+\varDelta y)]+[f(x_0,y_0+\varDelta y)-f(x_0,y_0)]\tag{5}\]

　　类似地，我们把式（4）中的线性部分称为\(f(x,y)\)在区域内点\((x_0,y_0)\)的全微分，记作\(\text{d}f\)，而\(A\varDelta x\)称为关于\(x\)的偏微分，记作\(\text{d}_x\,f\)（式（6））。由此，偏导数还可以写作式（7），它也被偏微商。在定义域内处处可微的函数称为可微函数，偏导数都连续的（必定可微）函数称为连续可微，一般记作\(f(x,y)\in C^1\)。

\[\text{d}f(x,y)=\text{d}_xf(x,y)+\text{d}_yf(x,y)=f'_x(x,y)\,\text{d}x+f'_y(x,y)\,\text{d}y\tag{6}\]

\[f'_x(x,y)=\dfrac{\text{d}_xf(x,y)}{\text{d}x};\quad f'_y(x,y)=\dfrac{\text{d}_yf(x,y)}{\text{d}y}\tag{7}\]

2.2 链锁法则及其应用

　　偏导数的计算与一般导数无异，但对于复合函数，我们可以将一元函数中的链锁法则进行扩展。为简单起见，先设\(z=f(x,y)\)可微且有\(x=x(t),y=y(t)\)，再假设\(x'(t),y'(t)\)存在且有界。当\(\varDelta t\to 0\)时可有\(\varDelta x\to 0,\varDelta y\to 0\)，从而式（4）成立，两边除以\(\varDelta t\)可得式（8）。这个公式的好处是将函数分割为几个维度来处理，比如对于\(f(t)^{g(t)}\)的函数就不必变形而直接使用\(x^y\)的结论。当\(x,y\)为多元函数时，偏导数有同样的结论。

\[\dfrac{\text{d}z}{\text{d}t}=\dfrac{\partial z}{\partial x}\dfrac{\text{d}x}{\text{d}t}+\dfrac{\partial z}{\partial y}\dfrac{\text{d}y}{\text{d}t}\tag{8}\]

　　一元函数的链锁法则得到了一元微分的形式不变性，这个结论在多元函数中仍然成立。设\(z=f(x,y),x(u,v),y(u,v)\)都连续可微，首先易证在领域内\(x,y\)对\(u,v\)的偏导数有界，从而\(z\)对\(u,v\)的偏导数存在且连续。将\(z'_u,z'_v\)的链锁表达式带入\(\text{d}z=z'_u\,\text{d}u+z'_v\,\text{d}v\)，整理后容易得到式（6），这就说明了多元微分也有形式不变性，它使得求偏导数更加方便。

　　现在来看看对于多元函数，是否有中值定理。设\(f(x,y)\)可微，取两点\(M_0=(x_0,y_0),M_1=(x_0+\varDelta x,y_0+\varDelta y)\)，考察直线\(x=x_0+t\varDelta x,y=y_0+t\varDelta y\)上的值\(F(t)\)（当然还要求直线都在定义域内）。利用拉格朗日中值定理可知\(F(1)-F(0)=F'(\theta)\)，而由链锁法则可有式（9）成立。特别地，如果区域内\(f'_x,f'_y\)恒为零，则\(f(x,y)\)为常数。

\[f(x_0+\varDelta x,y_0+\varDelta y)-f(x_0,y_0)=f'_x(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta x+f'_y(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta y\tag{9}\]

2.3 高阶微分

　　偏导数函数本身当然也可以存在偏导数，它们被称为二阶偏导数，它的记法如式（10）所示。要注意混合偏导数中变量的次序，不同的次序的偏导数不一定相等（\(xy\dfrac{x^2-y^2}{x^2+y^2}\)）。为弄清原因，用极限式表示两种次序的混合偏导数（式（11），其中\(w(h,k)=f(x_0+h,y_0+k)-f(x_0+h,y_0)-f(x_0,y_0+k)+f(x_0,y_0)\)），容易看出结果不同原因，本质上是累次极限的不同。

\[\dfrac{\partial}{\partial y}\left({\dfrac{\partial f}{\partial x}}\right)=\dfrac{\partial^2 f}{\partial y\partial x}=f''_{xy};\quad\dfrac{\partial}{\partial x}\left({\dfrac{\partial f}{\partial x}}\right)=\dfrac{\partial^2 f}{\partial x^2}=f''_{xx}=f''_{x^2}\tag{10}\]

\[f''_{xy}=\lim\limits_{k\to 0}{\lim\limits_{h\to 0}{\dfrac{w(h,k)}{hk}}};\quad f''_{yx}=\lim\limits_{h\to 0}{\lim\limits_{k\to 0}{\dfrac{w(h,k)}{hk}}}\tag{11}\]

　　为得到两者相等的充分条件，可以利用式（3）的结论。首先假定\(f''_{xy},f''_{yx}\)在\((x_0,y_0)\)领域内存在，然后两次利用微分中值定理可得式（12）。按照式（3）的假设，还需要求\(f''_{xy}\)在\((x_0,y_0)\)处连续，这样\(\dfrac{w(h,k)}{hk}\)就存在重极限。而单独\(h\to 0\)时显然也存在极限，从而得到累加极限（11）相等且等于重极限。

\[w(h,k)=f''_{xy}(x_0+\theta_1h,y_0+\theta_2k),\quad(1<\theta_1,\,\theta_2<1)\tag{12}\]

　　高阶偏导数可以同样定义，且易知当\(f(x,y)\)的\(n\)阶混合偏导数都连续时，变量的顺序就不影响结果，偏导数就可以写成\(\dfrac{\partial^nf}{\partial^{i}x\partial^{n-i}y}\)。求高阶偏导数只是多次求一阶偏导数，故求解中可以继续使用链锁法则。更进一步地，如果\(f(x,y)\)的二阶偏导数存在且连续，则全微分（式（6））中的\(f'_x,f'_y\)的偏导数连续，从而\(\text{d}z\)也是可微的。记二阶全微分\(\text{d}^2z=\text{d}(\text{d}z)\)，容易推导出式（13）成立。

\[\text{d}^2z=\dfrac{\partial^2z}{\partial x^2}\text{d}x^2+2\dfrac{\partial^2z}{\partial x\partial y}\text{d}x\text{d}y+\dfrac{\partial^2z}{\partial y^2}\text{d}y^2\tag{13}\]

　　推导过程中容易发现，如果忽略符号\(z\)，符号\(X=\text{d}x\dfrac{\partial}{\partial x}\)和\(Y=\text{d}y\dfrac{\partial}{\partial y}\)可以看作是两个整体，求全微分的过程就像是多项式乘上\((X+Y)\)。这个过程对任何高阶全微分都成立，为了书写方便，可以将\(\text{d}^nz\)形式地写成式（14）。该式仅是形式上的简化，并不能简化实际计算过程。还要注意，高阶全微分的形式对中间变量的形式不变性不再成立。

\[\text{d}^nz=(\text{d}x\dfrac{\partial}{\partial x}+\text{d}y\dfrac{\partial}{\partial y})^nz\tag{14}\]

　　当\(f(x,y)\in C^{n+1}\)时（有直到\(n+1\)阶的连续偏导数），设\(F(t)=f(x_0+t\varDelta x,y_0+t\varDelta y)\)，对\(F(t)\)使用带拉格朗日余项的泰勒公式，可得多元函数的泰勒公式（15）。当\(f(x,y)\in C^n\)时，还可以利用式（15）得到皮亚诺余项\(o(\rho^n)\)。泰勒公式也能用来求多元函数的近似值。

\[F(1)=\sum\limits_{n=0}^n{\dfrac{1}{i!}\varDelta^i}F(0)+\dfrac{1}{(n+1)!}\varDelta^{n+1}F(\theta),\quad\varDelta^i=(\varDelta x\dfrac{\partial}{\partial x}+\varDelta y\dfrac{\partial}{\partial y})^i\tag{15}\]

2.4 隐函数

　　前面我们已经看到过，有时变量的关系是以\(F(x,y)=0\)这样的等式呈现的，并且无法或很难写成显式的\(y=f(x)\)。考察\(x^2-y^2=0\)，它在除原点外的局部其实都有函数关系式\(y=f(x)\)，这样的函数我们称之为由\(F(x,y)=0\)定义的隐函数。既然无法显式地写出\(f(x)\)，它的连续和微分性质只能通过\(F(x,y)\)讨论，这里就来讨论一下这些问题。

　　首先要注意，隐函数是在局部讨论的（这样讨论的范围更广），所以设\(F(x_0,y_0)=0\)而讨论\((x_0,y_0)\)的邻域。我们希望在\(x_0\)的某个邻域内的\(x'\)，有唯一的\(y'\)使得\(F(x',y')=0\)。（以下讨论以函数图形为参考更好理解）最容易想到的是连续函数的零点定理，为此先假定\(F(x,y)\)在\((x_0,y_0)\)的邻域内连续。然后要构造\(f(x',y_0\pm\varDelta y)\)是异号的，为此只要假定\(f(x',y)\)在局部关于\(y\)单调，因为这样的话\(f(x_0,y_0\pm\varDelta y)\)异号，在足够小的邻域内也会有\(f(x',y_0\pm\varDelta y)\)异号。

　　由\(F(x_0,y)\)的单调性和\(F(x,y)\)的连续性还容易证明（反证），\(x'\to x_0\)时必定有\(y'\to y_0\)。从而\(f(x)\)在\((x_0,y_0)\)连续，同样可以证明在邻域内都是连续的。总结以上便有，如果\(F(x,y)\)满足\(F(x_0,y_0)=0\)，且在\((x_0,y_0)\)的邻域里连续，还有关于\(y\)单调，那么在这个邻域内存在连续的隐函数\(y=f(x)\)。其中关于\(y\)单调的条件可以加强为：\(F'_y\)在\((x_0,y_0)\)的邻域里存在且有单一符号，或者更强的条件是：\(F'_y\)在\((x_0,y_0)\)处连续且非零。

　　如果还要使\(f(x)\)在点\((x_0,y_0)\)处可微，其实就是讨论\(\varDelta x,\varDelta y\)的关系，容易想到式（9）的中值定理。为此先要假设\(F'_x,F'_y\)在邻域内连续（从而可微），利用中值定理可得式（16），表示成\(\dfrac{\varDelta y}{\varDelta x}\)后利用\(F'_x,F'_y\)的连续性可得式（17）。总结就是说，如果在\((x_0,y_0)\)的一个邻域内\(F,F'_x,F'_y\)都连续，且\(F'_y(x_0,y_0)\ne 0\)，则在这个邻域内有可微隐函数，且导数为式（17），导数也是连续的。以上两个结论对多元函数\(F(x_1,\cdots,x_n,y)\)同样成立，证明也类似，请自行描述且论证。

\[0=F(x',y')-F(x_0,y_0)=F'_x(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta x+F'_y(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta y\tag{16}\]

\[y'_x=-\dfrac{F'_x(x,y)}{F'_y(x,y)}\tag{17}\]

3. 向量值函数

　　当多个函数\(f_1,\cdots,f_m\)依赖于同一组自变量\(x_1,\cdots,x_n\)时，可以将\((f_1,\cdots,f_m)\)做为一个向量看待，函数\(\vec{f}(\vec{x})\)被称为向量值函数。这种函数其实可以拆成独立的多元函数分别研究，所以我们仅专注一些有漂亮形式特点的结论。诸如极限、连续的概念都比较简单，其实向量值函数连续等价于每个多元函数分别连续，这里不作赘述。

　　类似地，当每个多元函数可微时，也称向量值函数可微。如果用\(\text{d}\vec{f},\,\text{d}\vec{x}\)表示微分，而偏微分组成的矩阵（18）称为雅克比矩阵，则可微函数有式（19）成立，这里的雅克比矩阵起到了类似导数的作用。如果有\(\vec{z}=\vec{f}(\vec{y}),\,\vec{y}=\vec{g}(\vec{x})\)，且\(\vec{f},\vec{g}\)的偏导数连续，同样有式（20）左的链锁法则成立，且易知一阶微分的形式不变性也成立（式（20）右）。

\[J\,[\,\vec{f}(\vec{x})\,]=\begin{bmatrix}\dfrac{\partial f_1}{\partial x_1}&\cdots&\dfrac{\partial f_1}{\partial x_n}\\\vdots&\ddots&\vdots\\\dfrac{\partial f_m}{\partial x_1}&\cdots&\dfrac{\partial f_m}{\partial x_n}\end{bmatrix};\quad |J_n|=\dfrac{\partial(f_1,\cdots,f_n)}{\partial(x_1,\cdots,x_n)}\tag{18}\]

\[\text{d}\vec{f}\,=\,J\,[\,\vec{f}(\vec{x})\,]\,\text{d}\vec{x}\tag{19}\]

\[J\,[\,\vec{f}\circ\vec{g}\,]=J\,[\,\vec{f}\,]\cdot J\,[\,\vec{g}\,];\quad \text{d}\vec{z}=J\,[\,\vec{f}\circ\vec{g}\,]\,\text{d}\vec{x}=J\,[\,\vec{f}\,]\,\text{d}\vec{y}\tag{20}\]

　　上面的隐函数的结论在向量值函数中仍然成立，比如向量值函数\(\vec{F}(\vec{x},\vec{y})\)的定义域为\(n+m\)维，值域为\(m\)维，设\(\vec{F}\)及其一阶偏导数都连续，另外\(\vec{F}\)在\((\vec{x}_0,\vec{y}_0)\)处值为\(0\)且对于\(\vec{y}\)的雅克比行列式\(|J_m|=\dfrac{\partial\vec{F}}{\partial\vec{y}}\)非零，那么方程组\(\vec F\equiv 0\)在\((\vec{x}_0,\vec{y}_0)\)附近确定唯一的隐函数\(\vec{y}=\vec{f}(\vec{x})\)。可以由\(|J_m|\ne 0\)非零先找到某个\(\dfrac{\partial F_i}{\partial y_m}\ne 0\)，并由条件确定唯一隐函数\(y_m=\varphi(x_1,\cdots,y_{m-1})\)，带入其它\(m-1\)个方程便将问题降到\(m-1\)维。用连锁法则对\(J_m\)变形即能证明新的雅克比行列式也非零，故用归纳法能得到唯一的隐函数，且在局部连续。

　　类似式（16）的讨论，可以在每个\(F_i=0\)上对\(x_j\)求导，得到\(mn\)个方程组（21）。由于\(|J_m|\ne 0\)，由克莱姆法则可解得隐函数的所有偏导数（式（22））。

\[\dfrac{\partial F_i}{\partial x_j}+\dfrac{\partial F_i}{\partial y_1}\cdot\dfrac{\partial y_1}{\partial x_j}+\cdots+\dfrac{\partial F_i}{\partial y_m}\cdot\dfrac{\partial y_m}{\partial x_j}=0\tag{21}\]

\[\dfrac{\partial y_j}{\partial x_i}=-{\dfrac{\partial\vec{F}}{\partial\vec{y}_{ij}}}\left/{\dfrac{\partial\vec{F}}{\partial\vec{y}}}\right.,\quad\vec{y}_{ij}=(\cdots,y_{j-1},x_i,y_{j+1},\cdots)\tag{22}\]

posted on 2016-03-03 08:59 卞爱华阅读(2435) 评论(0) 收藏举报

刷新页面返回顶部

万物皆数