微积分 A(1) —— 导数与微分
\(\newcommand{\a}{\alpha} \newcommand{\b}{\beta} \newcommand{\o}{\omega} \newcommand{\D}{\Delta} \newcommand{\de}{\delta} \newcommand{\si}{\sigma} \newcommand{\Si}{\Sigma} \newcommand{\w}{\wedge} \newcommand{\om}{\Omega} \newcommand{\eps}{\varepsilon} \newcommand{\ph}{\varphi} \newcommand{\t}{\theta} \newcommand{\la}{\lambda} \newcommand{\ga}{\gamma} \newcommand{\d}{\mathrm{d}} \newcommand{\DD}{\mathrm{D}} \newcommand{\e}{\mathrm{e}} \newcommand{\i}{\mathrm{i}} \newcommand{\N}{\mathbb{N}} \newcommand{\F}{\mathbb{F}} \newcommand{\Z}{\mathbb{Z}} \newcommand{\Q}{\mathbb{Q}} \newcommand{\R}{\mathbb{R}} \newcommand{\C}{\mathbb{C}} \newcommand{\fr}{\frac} \newcommand{\l}{\left} \newcommand{\r}{\right} \newcommand{\ov}{\overline} \newcommand{\ud}{\underline} \newcommand{\bs}{\backslash} \newcommand{\mps}{\mapsto} \newcommand{\pa}{\partial} \newcommand{\str}{\stackrel} \newcommand{\op}{\operatorname} \newcommand{\tr}{\operatorname{tr}} \newcommand{\gr}{\operatorname{grad}} \newcommand{\cu}{\operatorname{curl}} \newcommand{\di}{\operatorname{div}} \newcommand{\rot}{\operatorname{rot}} \newcommand{\abs}[1]{\left| #1 \right|} \newcommand{\infn}[1]{\| #1 \|_{\infty}} \newcommand{\p}[2]{\fr {\pa #1} {\pa #2}} \newcommand{\dd}[2]{\fr {\d #1} {\d #2}} \newcommand{\se}[2]{\sum_{#1 = #2} ^ \infty} \newcommand{\seq}[2]{\{{#1}_{#2}\}_{{#2}\geq 1}} \newcommand{\an}[1]{\left \langle #1 \right\rangle} \newcommand{\na}{\nabla} \newcommand{\lan}{\langle} \newcommand{\ran}{\rangle} \newcommand{\scr}{\mathscr} \newcommand{\bf}{\mathbf} \newcommand{\rm}{\mathrm} \newcommand{\xeq}{\xlongequal} \newcommand{\bal}{\begin{aligned}} \newcommand{\eal}{\end{aligned}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bvm}{\begin{vmatrix}} \newcommand{\evm}{\end{vmatrix}} \newcommand{\st}{\mathrm{s.t.} \ \ }\)
107 导数与微分
内容:
- 微分与导数的概念。
- 微分与导数的运算规律。
- 曲线与曲线的切线。
相关概念
微积分的核心思想是给函数在局部寻找简单近似。近似为常值函数引出了连续的概念,近似为线性函数引出了微分的概念。
线性函数
称 \(L : \R \to \R\) 是 线性函数,若
一维线性函数是正比例函数 \(L(x) = L(x\cdot 1) = xL(1)\)。
内点
称 \(x_0\) 为 \(I\) 的内点,若
内点一定是聚点。聚点要求一串收敛到 \(x_0\) 的点,内点要求 \(x_0\) 完全在某个区间内。
可微和微分
设 \(x_0\) 为 \(I\) 的内点。称函数 \(f : I\to \R\) 在 \(x_0\) 处可微,指存在线性函数 \(L\) 使得
称 \(L\) 为 \(f\) 在 \(x_0\) 处的 微分,记作 \(\d f(x_0)\)。
若 \(f\) 在 \(x_0\) 处可微,则 \(f(x) = f(x_0) + O(x - x_0),\ x\to x_0\),则 \(f\) 在 \(x_0\) 处连续。可微一定连续,不连续一定不可微。
本质:在局部给非线性函数找线性近似,使误差是自变量变化量的高阶无穷小。于是线性函数的微分是它本身。
导数
一元函数的微分 \(\d f(x_0)\) 是正比例函数,其比例系数记为 \(f'(x_0)\),称为 \(f\) 在 \(x_0\) 处的 导数。
微分是直线,导数是斜率。
可导
如果函数可微,则
于是
若该极限存在,则称 \(f\) 在 \(x_0\) 处可导。一元函数可微等价于可导。
传统记号:记 \(\D x = h\),\(\D y = f(x_0 + \D x) - f(x_0)\)。
例 \(1\)
\(ax + b\) 的微分。
解
\[a(x + h) + b = (ax + b) + {\color{red}ah},\quad h\to 0 \]所以
\[\d(ax + b)(h) = ah,\ (ax + b)' = a \]
例 \(2\)
\(x ^ n\) 的微分。
解
\[(x + h) ^ n = x ^ n + {\color{red} nx ^ {n - 1}} + {\color{blue}o(h)}, \quad h\to 0 \]所以
\[\d x ^ n(h) = n x ^ {n - 1} h,\ (x ^ n)' = n x ^ {n - 1} \]
例 \(3\)
\(\e ^ x\) 的微分。
解
\[\e ^ {x + h} = \e ^ x \e ^ h = \e ^ x(1 + h + o(h)) = \e ^ x + \e ^ x h + o(h), \quad h\to 0 \]所以
\[\d \e ^ x (h) = \e ^ x h,\ (\e ^ x)' = \e ^ x \]
例 \(4\)
\(\sin x\) 的微分。
解
\[\sin (x + h) = \sin x[1 + o(h)] + \cos x[h + o(h)] = \sin x + \cos x \cdot h + o(h), \quad h\to 0 \]所以
\[\d (\sin x)(h) = \cos x \cdot h,\ (\sin x)' = \cos x \]
必须熟练使用微分的视角,因为用极限求导数的方法在自变量有多维时不适用。
单侧导数
导数计算式的左极限称为 左导数,右极限称为 右导数。
由极限存在当且仅当左右极限存在且相等,可知函数在一点处可导当且仅当左右导数存在且相等。
例 \(5\)
\(|x|\) 不可微。
证明
\(|x|\) 的左导数为 \(-1\),右导数为 \(1\),极限不存在。
运算性质
复合函数微分(链索法则)
若 \(f\) 在 \(x_0\) 处可微,\(g\) 在 \(y_0 = f(x_0)\) 处可微,则 \(g\circ f\) 在 \(x_0\) 处可微,且
理解:对于两个线性函数,它们的复合的比例系数为它们各自比例系数的乘积。对于两个可微函数,先在局部近似看成线性函数,再做复合,等价于先复合再近似成线性函数。复合的微分是微分的复合。
证明
已知
\[\bal f(x_0 + h) - f(x_0) = ah + o(h), \quad h\to 0 \\ g(y_0 + v) - g(y_0) = bv + o(v), \quad v\to 0 \eal \]于是
\[\bal & g(f(x_0 + h)) - g(f(x_0)) \\ = \; & b(f(x_0 + h) - f(x_0)) + o(f(x_0 + h) - f(x_0)) \\ = \; & b(ah + o(h)) + o(ah + o(h)) \\ = \; & bah + o(h), \quad h\to 0 \eal \]\(\square\)
证明中不严谨的地方:\(v\to 0\) 要求 \(v\neq 0\),但 \(f(x_0 + h) - f(x_0)\) 可能为 \(0\)。
解决方法:当 \(v = 0\) 时,\(g(y_0 + v) - g(y_0) - bv = 0 = o(0)\),等式依然成立。
例 \(6\)
\(\cos x\) 的微分。
解
\[\d \cos x(h) = (\d \sin) \l(\frac \pi 2 - x\r) \l(\d \l(\frac \pi 2 - x\r)(h)\r) = \cos(\frac \pi 2 - x)(-1) h = -\sin x \cdot h \]
例 \(7\)
\(a ^ x\) 的微分。
解
\[\d a ^ x(h) = \d \l(\e ^ {x\ln a}\r) (h) = \e ^ {x \ln a} \ln a\cdot h = a ^ x\ln a \cdot h \]
反函数微分
设 \(f\) 有连续反函数,\(f\) 在 \(x_0\) 处可微且 \(f'(x_0)\neq 0\),则 \(f ^ {-1}\) 在 \(y_0 = f(x_0)\) 处可微,且
证明
\[y - y_0 = a(x - x_0) + o(x - x_0), \quad x\to x_0 \]于是
\[x - x_0 = \frac 1 a(y - y_0) + o(y - y_0), \quad y\to y_0 \]\(\square\)
例 \(8\)
\(\ln x\) 的导数。
解
\[(\ln y)'_y = \frac {1} {(\e ^ x)'_x} = \frac 1 {\e ^ x} = \frac 1 y \]
例 \(9\)
\(x ^ \mu\) 的导数。
解
\[(x ^ \mu)' = (\e ^ {\mu \ln x})'_x = \e ^ {\mu \ln x} \mu \frac 1 x = \mu x ^ {\mu - 1} \]
例 \(10\)
\(\arcsin x\) 和 \(\arccos x\) 的导数。
解
在 \((-\frac \pi 2, \frac \pi 2)\) 上 \((\sin x)' = \cos x \neq 0\)。设 \(y = \sin x\),则 \(x = \arcsin y\)。
\[(\arcsin y)_y' = \frac 1 {(\sin x)_x'} = \frac {1} {\cos x} = \frac {1} {\sqrt {1 - y ^ 2}} \]另一种思路
\(y = \arcsin x\iff x = \sin y\)。等号两侧同时对 \(x\) 求导,\(1 = \cos y \cdot y'_x\)。
于是
\[(\arcsin x)' = y'_x = \frac {1} {\cos y} = \frac {1} {\sqrt {1 - \sin ^ 2 y}} = \frac {1} {\sqrt {1 - x ^ 2}} \]由 \(\arccos x = \frac \pi 2 - \arcsin x\) 可知 \((\arccos x)' = - \frac {1} {\sqrt {1 - x ^ 2}}\)。
四则运算(一)
设 \(f, g\) 在 \(x_0\) 处可微,则 \(f + g, fg\) 在 \(x_0\) 处可微,且
第二行称为 Leibniz 公式。
证明
设 \(f(x_0 + h) = f(x_0) + ah + o(h),\ g(x_0 + h) = g(x_0) + bh + o(h)\)。
\[f(x_0 + h)g(x_0 + h) = f(x_0)g(x_0) + [f(x_0)b + g(x_0)a]h + o(h), \quad h\to 0 \]\(\square\)
微分的形式不变性
如何理解 \(f'(x) = \frac {\d y} {\d x},\ \d y = f'(x) \d x\):恒同映射 \(\mathrm{id}\) 的函数值是 \(x\) 自身。它是线性映射,其微分和它相等,\(\d x(h) = h\)。对 \(y = f(x)\),\(y\) 既代表函数值,又代表 \(f\) 本身,于是
因此
如果 \(y = y(u)\) 和 \(u = u(x)\) 可微,则链索法则可写为
写成微分即
无论 \(y\) 作为变量 \(x\) 的函数还是变量 \(u\) 的函数,微分 \(\d y\) 具有相同的形式 —— 微分的形式不变性。
反函数求导公式为
Leibniz 的符号体系方便初学者记忆,但也有很强的迷惑性。不要做经验主义的驴。
四则运算(二)
设 \(f, g\) 在 \(x_0\) 处可微,\(g(x_0)\neq 0\),则 \(f / g\) 在 \(x_0\) 处可微,且
证明
\[\l(\frac 1 x\r)' = -\frac 1 {x ^ 2} \]于是 \(\frac f g\) 可以看成 \(f \cdot h(g)\),其中 \(h = \frac 1 x\)。使用链索法则和 Leibniz 公式即得。\(\square\)
例 \(11\)
\(\tan x\) 和 \(\cot x\) 的导数。
解
\[\bal (\tan x)' & = \frac {(\sin x)'\cos x - (\cos x)'\sin x} {\cos ^ 2 x} = \frac {1} {\cos ^ 2 x} = 1 + \tan ^ 2 x = \sec ^ 2 x \\ (\cot x)' & = \frac {(\cos x)'\sin x - (\sin x)'\cos x}{\sin ^ 2x} = -\frac {1} {\sin ^ 2 x} = -1 - \cot ^ 2x = -\csc ^ 2 x \eal \]改除为乘(隐函数求导)
\(y \cos x = \sin x\),于是
\[y'\cos x - y\sin x = \cos x \\ \implies y' = 1 + y\tan x = 1 + \tan ^ 2 x \]
以上运算性质的重要之处在于它提供了可微性的保证。
例 \(12\)
\(\arctan x\) 的导数。
解
\(y = \arctan x\),于是 \(x = \tan y\),则
\[1 = (1 + \tan ^ 2 y) y'_x = (1 + x ^ 2)y'_x \]因此
\[(\arctan x)' = \frac {1} {1 + x ^ 2} \]
例 \(13\)(对数求导法)
\(u, v, w, z\) 都是关于 \(x\) 的可微函数,求 \(\frac {u ^ v w}{z ^ 2}\) 的导数。
解
记 \(y = \frac {u ^ v w} {z ^ 2}\),取对数
\[\ln |y| = v\ln |u| + \ln |w| - 2\ln |z| \]对 \(x\) 求导
\[\frac {y'} y = \frac {vu'} u + v'\ln u + \frac {w'} w - \frac {2z'} z \]所以
\[y' = \frac {u ^ v w} {z ^ 2} \l(\frac {vu'} u + v'\ln u + \frac {w'} w - \frac {2z'} z \r) \]
对数求导法的本质是 \((\ln |x|)' = \frac 1 x\)。对 \(y = y(x)\),有 \(|y| = |y(x)|\)。将绝对值下放至每一项乘积因子,再求导,可保证每一项非负。需要特殊讨论 \(y = 0\) 的情况。
初等函数都是可微函数。
曲线
定义
设 \(\bf x(t) = (x_1(t), \cdots, x_n(t))\ (a\leq t\leq b)\),其中每个 \(x_k : [a, b]\to \R\) 连续,在 \((a, b)\) 内可微,\(x'_k(t)\) 连续。此时称 \(\bf x(t)\) 为 \(\R ^ n\) 中一条 光滑曲线。
若对任意 \(t\in [a, b]\),\(x'_k(t)\) 不全为 \(0\),则称为 正则光滑曲线。
称 \(\bf x'(t_0) = (x_1'(t_0), \cdots, x_n'(t_0))\) 为曲线在 \(\bf x(t_0)\) 处的 切向量。\(\bf v = \lim_{t\to t_0} \fr {\bf x(t) - \bf x(t_0)} {t - t_0}\),对一元映射也可以定义微分和导数。
称 \(\bf x = \bf x(t_0) + \bf x'(t_0) s\ (s\in \R)\) 为曲线在 \(\bf x(t_0)\) 处的 切线。
与切向量正交的向量 \(\bf n\in \R ^ n\) 称为曲线在 \(\bf x(t_0)\) 处的一个 法向量。
称 \(\bf x = \bf x(t_0) + s\bf n\ (s\in \R)\) 为曲线在 \(\bf x(t_0)\) 处的一条 法线。
空间中的直线方程
过点 \(A\),方向为 \(\bf v\) 的直线:
称为 点向式方程。在比例关系中,若 \(v_k = 0\),则 \(x_k = a_k\)。
过点 \(A, B\) 的直线:
称为 两点式方程。
例 \(14\)
可微函数的图像是一条光滑曲线。
解
\((x(t), y(t))' = (1, f'(t))\) 不是零向量。
切线:\(y = f(t_0) + f'(t_0)(x - t_0) = f(x_0) + f'(x_0)(x - x_0)\)。
法向量:\((f'(t_0), -1)\)。
法线:\(\fr {x - x_0} {f'(x_0)} = \fr {y - y_0} {-1}\),即 \(f'(x_0)(y - f(x_0)) + (x - x_0) = 0\)。
例 \(15\)
\(\sqrt x\) 不是可微函数,但 \(y = \sqrt x\) 是一条光滑曲线。
例 \(16\)
在原点处与抛物线 \(y = x ^ 2\) 有共同切线的圆中,哪一个与抛物线最接近?
解
切线为 \(x\) 轴,圆心在 \(y\) 轴上,设圆方程为 \(x ^ 2 + (y - c) ^ 2 = c ^ 2\)。
\[y = c - \sqrt {c ^ 2 - x ^ 2} = c\l[1 - \l(1 - \fr 1 2\fr {x ^ 2} {c ^ 2} + o(x ^ 2)\r)\r] = \fr {x ^ 2} {2c} + o(x ^ 2) \]解得 \(c = \fr 1 2\)。因此 \(x ^ 2 + (y - \fr 1 2) ^ 2 = \fr 1 4\) 和 \(y = x ^ 2\) 在原点附近最接近。
定义圆的曲率为其半径的倒数。光滑曲线在一点处的曲率为密切圆的曲率。
如何计算密切圆?圆心在法线上,且圆的任何两条直径交于圆心。在当前点的附近取法线,和当前点的法线求交点,取极限。只在二维时有用。
例 \(17\)
计算圆 \(x ^ 2 + y ^ 2 = 1\) 的切线。
解
圆的参数方程为 \(x(\t) = \cos \t,\ y(\t) = \sin \t\)。切线方程
\[\bc x = x(\t) + sx'(\t) = x_0 - sy_0 \\ y = y(\t) + sy'(\t) = y_0 + sx_0 \ec \implies x_0(x - x_0) + y_0(y - y_0) = 0 \implies x_0x + y_0y = 1 \]另解
圆的参数方程为 \(x(t) = \fr {1 - t ^ 2} {1 + t ^ 2},\ y(t) = \fr {2t} {1 + t ^ 2}\)。
108 高阶导数
内容:
- 高阶导数的定义。
- 高阶导数的计算。
- 高阶导数的应用。
相关概念
高阶导数
若 \(f\) 在区间 \(I\) 内处处可微,则称函数 \(f ^ {(1)} := f' : I\to \R\) 为 \(f\) 的一阶 导函数。
若已有 \(f\) 的 \(n\) 阶导函数 \(f ^ {(n)}\),且 \(f ^ {(n)}\) 在 \(x_0\) 处可导,则记 \(f ^ {(n + 1)}(x_0) = (f ^ {(n)})'(x_0)\) 称为 \(f\) 在 \(x_0\) 处的 \(n + 1\) 阶导数。
\(f \in \scr C ^ {n}(I)\) 表示 \(f ^ {(n)}\) 是 \(I\) 上的连续函数。
\(f \in \scr C ^ {\infty}\) 表示 \(f\) 在 \(I\) 上有任意阶导数。
用 Leibiniz 的符号表示高阶导数:
基本初等函数的高阶导数
运算性质
四则运算(一)
证明即归纳。
复合函数
设 \(f\) 在 \(x_0\) 处 \(n\) 阶可微,\(g\) 在 \(y_0 = f(x_0)\) 处 \(n\) 阶可微,则 \(g\circ f\) 在 \(x_0\) 处 \(n\) 阶可微。
证明
对 \(n\) 做数学归纳。假设 \(n\) 时结论成立,设 \(f\) 在 \(x_0\) 处,\(g\) 在 \(y_0\) 处 \(n + 1\) 阶可微。则 \(f', g'\) 在 \(x_0, y_0\) 处 \(n\) 阶可微。根据归纳假设,\(g'\circ f\) 在 \(x_0\) 处 \(n\) 阶可微,于是 \((g' \circ f) \cdot f\) 在 \(x_0\) 处 \(n\) 阶可微。由链索法则 \((g \circ f)'(x) = g'(f(x))f'(x)\),所以 \((g\circ f)'\) 在 \(x_0\) 处 \(n\) 阶可微。\(\square\)
\((g\circ f) ^ {(n)}\) 是关于 \(f', f'', \cdots, f ^ {(n)}, g'\circ f, g'' \circ f, \cdots, g ^ {(n)} \circ f\) 的多项式。
复合函数的高阶导数公式(Faa di Bruno)
当内层是一次函数时,\((g(ax + b)) ^ {(n)} = g ^ {(n)}(ax + b)a ^ n\)。
四则运算(二)
设 \(f, g\) 在 \(x_0\) 处 \(n\) 阶可微,且 \(g(x_0)\neq 0\),则 \(f / g\) 在 \(x_0\) 处 \(n\) 阶可微。
例 \(1\)
\(y = \fr 1 {1 + x ^ 2}\) 的高阶导数。
解(一)
\[(1 + x ^ 2) y = 1 \]\[(1 + x ^ 2) y ^ {(n)} + n \cdot 2xy ^ {(n - 1)} + n(n - 1) y ^ {(n - 2)} = 0 \]得到递推关系
\[y ^ {(n)} = - \fr {2xny ^ {(n - 1)}} {1 + x ^ 2} - \fr {n(n - 1) y ^ {(n - 2)}} {1 + x ^ 2} \]解(二)
\[y = \fr 1 {2\i} \l(\fr 1 {x - \i} - \fr 1 {x + \i}\r) \]\[y ^ {(n)} = \fr 1 {2\i} \l(\fr {n! (-1) ^ n} {(x - \i) ^ {n + 1}} - \fr {n!(-1) ^ n} {(x + \i) ^ {n + 1}} \r) = \fr {n!(-1) ^ n} {2\i} \fr {(x + \i) ^ {n + 1} - (x - \i) ^ {n + 1}} {(1 + x ^ 2) ^ {n + 1}} \]
反函数
设 \(f\) 在区间 \(I\) 上 \(n\) 阶可微且 \(f'(x)\neq 0\)(此时 \(f\) 在 \(I\) 上有连续的反函数),则 \(f ^ {-1}\) 在区间 \(f(I)\) 上 \(n\) 阶可微。
证明
\[(f ^ {-1})' = \fr 1 {f'\circ f ^ {-1}} \]归纳即可。\(\square\)
推论:所有初等函数都是 \(\scr C ^ {\infty}\) 函数。
例 \(2\)
推导反函数的二阶导数公式。
解
\[\fr {\d ^ 2 x} {\d y ^ 2} = \dd {} y \l(\dd x y\r) = \dd {} x \l(\fr 1 {\dd y x}\r) \dd x y = \fr {-\fr {\d ^ 2y} {\d x ^ 2}} {\l(\dd y x\r) ^ 2} \fr {1} {\dd y x} = \fr {-y''} {(y') ^ 3} \]
对于写不出表达式的反函数,对反函数求导可以求出反函数在某点处的任意阶导数,得到 Taylor 展开的近似。如 \(x(t) = t - \eps \sin t\)。
应用
参数方程的高阶导数
设平面曲线 \((x(t), y(t))\) 二阶可微。若 \(x'(t)\neq 0\),则存在 \(\scr C ^ 2\) 的反函数 \(t = t(x)\),从而 \((x, y(t(x)))\) 是以 \(x\) 为自变量的函数图像。
曲线的曲率
在现有工具下推导较复杂。
从物理的角度看,\(\bf v = \bpm x'(t) \\ y'(t) \epm\),\(\bf a = \bpm x''(t) \\ y''(t) \epm\),\(\fr {\det (\bf v, \bf a)} {\|\bf v\|}\) 是 \(\bf v, \bf a\) 形成的平行四边形以 \(\bf v\) 为底边的高,即法向加速度 \(\bf a ^ {\perp}\) 的大小。得到 \(\kappa = \fr {\|\bf a ^ \perp\|} {\|\bf v\| ^ 2}\).
从量纲的角度看,\(\kappa\) 的量纲为 \(L ^ {-1}\)。因此它与时间无关,反映了运动的几何性质。对任意维度的空间曲线 \(\bf x(t)\),\(\kappa = \fr {\abs {\det (\bf x'(t), \bf x''(t))}} {\|\bf x'(t)\| ^ 3}\) 与曲线的参数表达无关,反映了曲线的几何性质,是曲线的曲率。
如何计算 \(\det(\bf u, \bf v)\)(高维空间中 \(\bf u, \bf v\) 形成的平行四边形面积)?使用向量内积:
于是高维空间中曲率的计算公式
109 微分中值定理
微分中值定理是连接导数的微观性质和函数的宏观性质的桥梁。
内容:
- 极值和驻点,Fermat 引理。
- 微分中值定理,Rolle-Cauchy-Lagrange。
- 应用:函数的单调性。
- 应用:用导数判断极值。
定理介绍
极值点和驻点
称 \(x_0\in I\) 为 \(f\) 的 极大值点,若存在 \(x_0\) 的邻域 \(V\) 使得 \(\forall x\in V\cap I,\ f(x)\leq f(x_0)\)。类似定义极小值点。
称 \(x_0\in I\) 为 \(f\) 的 临界点(驻点),若 \(f'(x_0) = 0\)。
导数与单调性(一)
若可微函数 \(f\) 在 \((a, b)\) 上单调不减,\(\forall x_0\in (a, b)\),根据极限的保号性,\(f'(x_0)\geq 0\)。因此,若 \(f'(x_0) < 0\),则 \(f\) 在 \(x_0\) 的任意邻域内都不是单调不减,且存在 \(\delta > 0\) 使得
于是
即 \(x_0\) 不是 \(f\) 的极值点。
考虑
当 \(A > 1\) 时,\(f'(\frac {\pm 1}{2k\pi}) = 1 - A < 0\),\(f\) 在 \(0\) 的任意邻域内非严格增。因此,\(f'(x) > 0\) 不能说明 \(f\) 在 \(x\) 的邻域内单调不减。\(x ^ 2 \sin \frac 1 x\) 常用于构造反例。
总结:(严格)单调则导数有对应(严格)符号。导数有对应符号则不一定单调。
Fermat 引理
设 \(f\) 在极值点 \(x_0\) 处可微,则 \(x_0\) 是 \(f\) 的临界点。
证明
若 \(f'(x_0) \neq 0\),则 \(x_0\) 的任意邻域中,\(f(x_0)\) 都不是最大值或最小值,\(x_0\) 不是 \(f\) 的极值点。\(\square\)
Rolle 定理
设 \(f\) 在 \([a, b]\) 上连续,在 \((a, b)\) 内可微,且 \(f(a) = f(b)\),则存在 \(\xi\in (a, b)\) 使得 \(f'(\xi) = 0\)。
推广的 Rolle 定理
设 \(-\infty \leq a < b \leq +\infty\),\(f\) 在 \((a, b)\) 内可微,且
\[\lim_{x\to a ^ +} f(x) = \lim_{x\to b ^ -} f(x) = A \in \R \cup \{\pm\infty\} \]则存在 \(\xi \in (a, b)\) 使得 \(f'(\xi) = 0\)。
证明
假设存在 \(x_0\) 使得 \(f(x_0) \neq A\),否则 \(f\) 为常值函数,结论成立。
不妨设 \(f(x_0) < A\),则存在 \(a < x_1 < x_0 < x_2 < b\) 使得 \(f(x_1) > f(x_0)\),\(f(x_2) > f(x_0)\)。
因为 \(f\) 可微,所以 \(f\) 连续,于是 \(f\) 在有界闭区间 \([x_1, x_2]\) 上有最小值 \(f(\xi)\),且 \(\xi \in (x_1, x_2)\)。于是 \(\xi\) 是可微极值点。根据 Fermat 引理,\(f'(\xi) = 0\)。\(\square\)
Cauchy 微分中值定理
设 \(-\infty \leq a \leq b \leq +\infty\),\(\a, \b, A, B\in \R\),\(f, g\) 在开区间 \((a, b)\) 内可微,且 \(f\) 在 \(a ^ +\) 和 \(b ^ -\) 处的极限分别为 \(\a, \b\),\(g\) 在 \(a ^ +\) 和 \(b ^ -\) 处的极限分别为 \(A, B\),则存在 \(\xi\in (a, b)\) 使得
证明
令
\[F(x) = (f(x) - \a)(B - A) - (g(x) - A)(\b - \a) \]则 \(F\) 在 \((a, b)\) 内可微且 \(\lim_{x\to a ^ +} F(x) = \lim_{x\to b ^ -} F(x) = 0\)。由 Rolle 定理得证。\(\square\)
这里 \(\a, \b, A, B\) 都是极限而非函数的具体取值,这使得它的适用范围更广,如 L’ Hopital 法则的正确性证明。
Cauchy 微分中值定理的传统形式要求 \(f, g\) 在 \([a, b]\) 上连续,在 \((a, b)\) 内可微且 \(g'(x) \neq 0\),则存在 \(\xi \in (a, b)\) 使得
Lagrange 微分中值定理
设 \(f\) 在 \([a, b] \) 上连续,在 \((a, b)\) 内可微,则存在 \(\xi \in (a, b)\) 使得
证明
取 \(g(x) = x\),使用 Cauchy 微分中值定理即可。\(\square\)
Lagrange 中值定理也可以写成极限的形式。
总结
Cauchy 中值定理是 Lagrange 中值定理的参数方程形式。Lagrange 中值定理将 Rolle 定理水平化斜,且最常用。
微分中值定理的几何解释:可微曲线上任意两点之间存在切线与这两点所连的弦平行的点。
-
在任意一段平面运动过程中,存在速度与总位移平行的时刻。
-
对于参数曲线 \(\begin{cases} x = t ^ 3 \\ y = t ^ 2 \end{cases}\),曲线图像形如 \(\curlyvee\),此时 Cauchy 中值定理还有效吗?\(x'(0) = y'(0) = 0\)。几何切线与速度向量不一定相同。
-
Cauchy 微分中值定理的几何解释只适用于平面曲线,不适用于空间曲线。
应用
导数与单调性(二)
设 \(f\) 在区间 \(I\) 上连续,在 \(I\) 内可微,则:
- \(\forall x\in I, f'(x) \geq 0\iff\) \(f\) 在 \(I\) 上单调不减。
- $\forall x\in I, f'(x) = 0\iff $ \(f\) 在 \(I\) 上为常值。
- $\forall x\in I, f'(x) > 0\ \ {\color {red}\implies} $ \(f\) 在 \(I\) 上严格增。
导数的非严格符号等价于函数的非严格单调性,但只能从导数的严格符号推出函数的严格单调性,反之则不行。反例:\(f(x) = x ^ 3\)。
例 \(1\)
讨论函数 \(f(x) = (1 + \frac 1 x) ^ {x + a}\) 的单调性。
解
定义域 \((-\infty, -1)\cup (0, +\infty)\)。
以 \(\e\) 为底换掉指数上的 \(x\),即令 \(f(x) = \e ^ {g(x)}\),则 $g(x) = (x + a)\ln(1 + \frac 1 x) $ 且 \(f, g\) 单调性相同。
\[g'(x) = \ln(1 + \frac 1 x) + (x + a)\left(\frac {1}{x + 1} - \frac 1 {x}\right) \]一阶导数较复杂,求二阶导。
\[g''(x) = \frac {(2a - 1) x + a} {x ^ 2(x + 1) ^ 2} \]若 \(a = \frac 1 2\),则 \(g''(x) > 0\),\(g'(x)\) 在定义域的每个区间上 是严格增函数。计算得 \(g'(\pm \infty) = 0\),于是 \(g'\) 在 \((-\infty, -1)\) 上大于 \(0\),在 \((0, +\infty)\) 上小于 \(0\)。因此 \(g\) 在 \((-\infty, -1)\) 上严格增,\(f\) 从 \(\e\) 增加到 \(+\infty\);在 \((0, +\infty)\) 上严格减,\(f\) 从 \(+\infty\) 减小到 \(\e\)。
\(a \neq \frac 1 2\) 的情况留作练习。
讨论单调性时需要写单调区间和值域范围。
例 \(2\)
求参数 \(a, b\) 的范围,使得对任意 \(x > -1\) 且 \(x\neq 0\),都有 \(\frac {x} {1 + ax} < \ln(1 + x) < \frac {x} {1 + bx}\)。
解
研究 \(f_a(x) = \ln(1 + x) - \frac {x}{1 + ax}\) 恒为正或恒为负。
\[f_a'(x) = \fr {x[a ^ 2(x + 1) - (a - 1) ^ 2]} {(x + 1) (1 + ax) ^ 2} \]当 \(a = 0\) 时,\(f_0'(x) = \frac {-x} {1 + x}\),在 \((-1, 0)\) 上大于 \(0\),\(f\) 单调增;在 \((0, +\infty)\) 上小于 \(0\),\(f\) 单调减。因为 \(f_0(0) = 0\),所以对任意 \(x > -1\) 且 \(x\neq 0\) 都有 \(f_0(x) < 0\)。
当 \(a = 1\) 时,\(f_1'(x) = \fr {x} {(1 + x) ^ 2}\),在 \((-1, 0)\) 上小于 \(0\),\(f\) 单调减,在 \((0, +\infty)\) 上大于 \(0\),\(f\) 单调增。因为 \(f_1(0) = 0\),所以对任意 \(x > -1\) 且 \(x\neq 0\) 都有 \(f_1(x) > 0\)。
当 \(a\neq 0\) 且 \(a\neq 1\) 时,\(f_a((-1) ^ +) = -\infty\),\(f_a(+\infty) = +\infty\),\(f_a\) 变号。
综上,\(a = 1\),\(b = 0\),得到不等式
\[\fr {x} {1 + x} < \ln(1 + x) < x \]
用导数研究原函数单调性,原函数越简单越好。尽量让 \(\ln x\) 单独出现,求导后变成有理函数,方便讨论。
Darboux 定理
设 \(f\) 在区间 \(I\) 上可微,则 \(f'(I)\) 是区间。
证明
设 \(f'(x_1) < f'(x_2)\)。不妨设 \(x_1 < x_2\),则 \(\forall c\in (f'(x_1), f'(x_2))\):设 \(g(x) = f(x) - cx\),则 \(g'(x_1) < 0 < g'(x_2)\),于是 \(x_1, x_2\) 不是极小值点。\(g\) 在 \([x_1, x_2]\) 上有最小值点 \(\xi\in (x_1, x_2)\),根据 Fermat 引理,\(g'(\xi) = 0\),此时 \(f'(\xi) = c\)。\(\square\)
推论
若 \(f\) 在区间 \(I\) 上可微且 \(f'(x)\neq 0\),则 \(f\) 在 \(I\) 上严格单调。
导函数有 介值性。但导函数 不一定连续。反例:
该例中 \(f'\) 不连续,但 \(f'\) 仍具有介值性。函数的导函数不存在第一类间断点。
导数与极值(一)
设 \(f\) 在 \(x_0\) 处可微,\(f'(x_0) = 0\)。
若 \(f''(x_0) > 0\),则 \(x_0\) 是 \(f\) 的严格极小值点;
若 \(f''(x_0) < 0\),则 \(x_0\) 是 \(f\) 的严格极大值点。
证明
因为 \(f''(x_0)\) 存在,所以 \(f\) 在 \(x\) 的邻域 \(V\) 中一阶可微。
对任意 \(y, z\in V\) 且 \(y < x_0 < z\),都有 \(f'(y) < 0 < f'(z)\),于是 \(f\) 在 \(x_0\) 左侧邻域严格减,在 \(x_0\) 右侧邻域严格增,\(f\) 在 \(x_0\) 处取到极小值。\(\square\)
二阶导数的正负性结合 \(f'(x_0) = 0\) 推出一阶导数在 \(x_0\) 两侧的正负性,再根据导数与单调性的关系推出原函数在 \(x_0\) 两侧的单调性。如何记忆:\(f(x) = ax ^ 2\)。
导数与极值(二)
设 \(f\) 在 \(x_0\) 处 \(2n\) 阶可微,\(n\in \N ^ *\),且 \(\forall i\in [1, 2n - 1]\),\(f ^ {(i)}(x_0) = 0\)。
若 \(f ^ {(2n)}(x_0) > 0\),则 \(x_0\) 是 \(f\) 的严格极小值点;
若 \(f ^ {(2n)}(x_0) < 0\),则 \(x_0\) 是 \(f\) 的严格极大值点。
证明
对 \(n\) 作数学归纳,\(n = 1\) 时成立。
假设 \(n\) 时成立,且满足 \(n + 1\) 的条件,不妨设 \(f ^ {(2n + 2)}(x_0) > 0\),则由归纳假设知 \(f''\) 在 \(x_0\) 处取极小值。而 \(f''(x_0) = 0\),所以 \(f''\) 在 \(x_0\) 的去心邻域内恒正。因此 \(f'\) 在 \(x_0\) 左侧严格单调增至 \(0\),在 \(x_0\) 右侧从 \(0\) 开始严格单调增,于是 \(f\) 在 \(x_0\) 左侧严格单调减,在 \(x_0\) 右侧严格单调增,\(x_0\) 是严格极小值点。\(\square\)
推论
将上述定理中的 \(2n\) 改为 \(2n + 1\)(奇数)。
若 \(f ^ {(i)}(x_0) = 0,\ \forall i\in [1, 2n]\) 且 \(f ^ {(2n + 1)}(x_0) \neq 0\),则 \(x_0\) 一定不是 \(f\) 的极值点,且 \(f\) 在 \(x_0\) 的某个邻域内有严格单调性。注意 \(n = 0\) 时不成立。
考虑
在 \(x = 0\) 取严格极小值,但 \(\forall n\in \N,\ f ^ {(n)}(0) = 0\),且 \(x = 0\) 左右两侧函数都不单调。
椭圆的光学性质
在均匀介质中,从 \((-c, 0)\) 发出的所有光线经曲线 \((x(s), y(s))\) 反射后都汇聚到点 \((c, 0)\),求曲线方程。
根据费马原理,光沿最省时间的路径传播,于是 \(T'(s) = 0\),即 \(T(s)\) 是常数。因此曲线是椭圆。
折射定律
光线从 \((0, y_1)\) 出发经交界面 \(x\) 轴上的点 \((x, 0)\) 到点 \((x_2, y_2)\),用时
于是 \(T'\) 严格增,且
因此 \(T'\) 有唯一零点 \(x_*\),对应 \(T\) 的唯一最小值点。
根据
得 Snell 折射定律
最速降线问题
由机械能守恒得 \(v = \sqrt {2gy}\)。
变速运动最省时间的路径服从折射定律 \(\frac {\sin \theta} v = C\),而 \(y'_x = \cot\theta\),且 \(1 + \cot ^ 2\theta = \frac {1} {\sin ^ 2\theta} = \frac {1} {C ^ 22gy}\),于是 \(y\) 满足微分方程 \(y[1 + (y_x') ^ 2] = A\)。
验证摆线 \(\bc x = \frac A 2(\t - \sin \t) \\ y = \fr A 2(1 - \cos \t) \ec\) 是解。
110 函数的凹凸性
内容:
- 凸函数与凹函数的概念。
- 用导数判断函数的凹凸性。
- 凸函数的连续性与可微性。
- 凸函数的最值,曲线的凸性。
- 凸函数与不等式。
相关概念
凸函数和凹函数
称 \(f\) 在区间 \(I\) 上是 凸函数(其函数图像 下凸),若 \(\forall x_1, x_2\in I\) 以及 \(\forall t : 0 < t < 1\) 都有
若不等式的等号成立当且仅当 \(x_1 = x_2\),则称 \(f\) 为 严格凸函数。类似定义 凹函数。
下凸曲线的性质:弧位于弦的下方。
凸集
\(C\subseteq \R ^ n\) 是 凸集:\(\forall A, B\in C\),线段 \(AB\) 上的点都在 \(C\) 中。
\(f : I\to \R\) 是凸函数当且仅当 \(\{(x, y)\mid x\in I,\ y\geq f(x)\}\) 是 \(\R ^ 2\) 中的凸集。
例 \(1\)
证明 \(x ^ 2\) 在 \(\R\) 上是严格凸函数。
证明
\[(1 - t) x_1 ^ 2 + tx_2 ^ 2 - ((1 - t)x_1 + tx_2) ^ 2 = t(1 - t)(x_1 - x_2) ^ 2 \geq 0 \]等号成立当且仅当 \(x_1 = x_2\)。\(\square\)
例 \(2\)
证明 \(a ^ x\) 在 \(\R\) 上是严格凸函数。
证明
任取 \(x_1\neq x_2\) 以及 \(t\in (0, 1)\),设
\[g(t) = (1 - t)f(x_1) + tf(x_2) - f((1 - t)x_1 + tx_2) \]则 \(g(0) = g(1) = 0\),由 Rolle 定理,存在 \(\xi\in (0, 1)\) 使得 \(g'(\xi) = 0\)。
\[g''(t) = -f''((1 - t)x_1 + tx_2)(x_2 - x_1) ^ 2 < 0 \]\(g'\) 是严格减函数,\(g\) 在 \([0, \xi]\) 上严格增,在 \([\xi, 1]\) 上严格减,于是 \(\forall t\in (0, 1)\),
\[g(t) > \min \{g(0), g(1)\} = 0 \]\(\square\)
由证明,只要二阶导恒为正,就是严格凸函数。
定理(导数和凸函数)
在区间 \(I\) 上:
- 若 \(f\) 二阶可微,则 \(f'' \geq 0\) 当且仅当 \(f\) 是凸函数。
- 若 \(f\) 一阶可微,则 \(f'\) 单调不减(严格增)当且仅当 \(f\) 是凸函数(严格凸函数)。
证明
设 \(f\) 是可微凸函数。设 \(x_1 < x_2 < x_3\) 以及它们在函数图像上的对应点 \(P_1, P_2, P_3\),\(x_2 = (1 - t)x_1 + tx_3\),则
\[f(x_2) \leq (1 - t)f(x_1) + tf(x_3) \]设
\[k_1 = k_{P_1P_2} = \fr {f(x_2) - f(x_1)} {x_2 - x_1} \]\[k_2 = k_{P_1P_3} = \fr {f(x_3) - f(x_1)} {x_3 - x_1} \]\[k_3 = k_{P_2P_3} = \fr {f(x_3) - f(x_2)} {x_3 - x_2} \]因为
\[x_2 - x_1 = t(x_3 - x_1),\ f(x_2) - f(x_1) \leq t(f(x_3) - f(x_1)) \]所以
\[k_1 = \fr {f(x_2) - f(x_1)} {x_2 - x_1} \leq \fr {t(f(x_3) - f(x_1))} {t(x_3 - x_1)} = k_2 \]同理 \(k_2 \leq k_3\),于是 \(k_{P_1P_2} \leq k_{P_1P_3} \leq k_{P_2P_3}\)。
用 \(Q_1\) 从 \(P_2\) 向 \(P_1\) 逼近,\(Q_2\) 从 \(P_2\) 向 \(P_3\) 逼近,\(k_{P_1Q_1} \leq k_{P_1P_2}\leq k_{P_2P_3}\leq k_{P_3Q_3}\)。\(Q_1\to P_1\) 过程中 \(k_{P_1Q_1}\) 不断减小,\(Q_3\to P_3\) 类似,于是 \(f'(x_1) \leq k_{P_1P_2} \leq k_{P_2P_3} \leq f'(x_3)\)。
另一个方向由例 \(2\) 证明。\(\square\)
凸函数上任选三个点作三角形,中间的点一定朝下。
注意:
- 二阶导数的严格正负性可以推出函数的严格凸性,反之则不可以。考虑反例 \(x ^ 4\),严格凸,但二阶导不恒为正。根本原因是极限保序只有一个方向严格。
- 一阶导数严格的单调性等价于函数的严格凸性。
性质与应用
连续性和可微性
凸函数没有保证连续,所以需要研究它们的连续性与可微性。
设 \(f\) 是凸函数,\(x_1 < x_2 < x_3\)。设 \(g_k(x) = \frac {f(x) - f(x_k)} {x - x_k}\),因为
所以 \(g_1(x)\) 在 \(x_1\) 右侧单调不减,\(g_2(x)\) 在 \(x_2\) 右侧的值比它在 \(x_2\) 左侧的值大,\(g_3(x)\) 在 \(x_3\) 左侧单调不减。根据单调有界收敛定理,凸函数在非端点两侧一定有单侧切线,该点左连续且右连续,凸函数连续。
设 \(g(x) = \fr {f(x) - f(x_0)} {x - x_0}\),则
可知 \(f'_-(x_0) \leq f'_+(x_0)\)。
对 \(x_1 < x_2\) 有
可知 \(f'_-\) 和 \(f'_+\) 单调不减,且
- 若 \(f'_+\) 在 \(x_2\) 处连续,则 \(f_-'(x_2) = f_+'(x_2)\),\(f\) 在 \(x_2\) 处可导;
- 若 \(f'_-\) 在 \(x_1\) 处连续,则 \(f'_-(x_1) = f'_+(x_1)\),\(f\) 在 \(x_1\) 处可导。
因为单调函数的间断点至多有可数无穷个,所以除去一个至多可数无穷集,\(f\) 在 \(I\) 上处处可导。
最值性
若 \(x_0\) 是可微凸函数 \(f\) 的临界点,则 \(x_0\) 是 \(f\) 的最小值点。若 \(f\) 严格凸,则 \(x_0\) 是 \(f\) 的严格最小值点。
更一般的结论:
定理
若凸函数 \(f\) 可微,则 \(y = f(x)\) 位于它在任意 \(x_0\) 处的切线的上方。
\[f(x) \geq f(x_0) + f'(x_0)(x - x_0),\ \forall x \]若 \(f\) 严格凸,则取等当且仅当 \(x = x_0\)。
证明
令 \(g(x) = f(x) - f(x_0) - f'(x_0)(x - x_0)\),则 \(g\) 是可微凸函数且 \(g(x_0) = g'(x_0) = 0\)。\(\square\)
上述定理可加强为仅要求 \(f\) 在 \(x_0\) 处可微。
例 \(3\)
证明 \(\e ^ x > x + 1,\ \forall x\neq 0\)。
证明
\(\e ^ x\) 在 \(x = 0\) 处的切线为 \(x + 1\),而 \(\e ^ x\) 严格凸,于是 \(\e ^ x > x + 1,\ \forall x\neq 0\)。\(\square\)
例 \(4\)
求曲线 \(y = \frac {2x ^ 2} {x + 1}\) 的渐近线。
解
当 \(x \to -1\) 时有渐近线 \(x = -1\)。
当 \(x\to \infty\) 时
\[\frac {2x ^ 2} {x(1 + \frac 1 x)} = 2x\l[1 - \frac 1 x + o\l(\frac 1 x\r)\r] = 2x - 2 + o(1) \]于是渐近线为 \(y = 2x - 2\)。
此时渐近线像函数在无穷远处的切线,再根据凹凸性可知右侧分支永远在渐近线上方,左侧分支永远在渐近线下方。
Newton 法的全局收敛性
设凸函数 \(f\) 在 \((a, b)\) 上可微且 \(f'(x) > 0\)。若 \(f(a) < 0 < f(b)\),则 \(\forall x_0\in (a, b)\),只要 \(f(x_0) > 0\),Newton 迭代
收敛到 \(f\) 的唯一零点。
证明
\(x_n\) 单调递减收敛至 \(x ^ *\),\(f'(x_n)\) 单调不增且有下界 \(f'(x ^ *)\),因此有极限 \(\beta \geq f'(x ^ *)\)。此时
\[f(x ^ *) = \lim_{n\to +\infty} f(x_n) = \lim_{n\to +\infty} f'(x_n)(x_n - x_{n + 1}) = \beta \cdot 0 = 0 \]\(\square\)
其中 \(\xi_n \in (x ^ *, x_n)\) 且 \(f'(\xi_n)(x_n - x ^ *) = f(x_n) - f(x ^ *) = f(x_n)\)。在 \(n\to +\infty\) 的过程中,\(x_n\to (x ^ *) ^ +\),于是 \(f'(\xi_n)\) 和 \(f'(x_n)\) 都趋于 \(f'(x)\) 在 \(x ^ *\) 处的右极限,因此收敛速度逐渐加快。
平面参数曲线
\((x(t), y(t))\) 是平面正则曲线(任意时刻 \(x'(t)\) 和 \(y'(t)\) 至少一个不为 \(0\)),设 \(x'(t) \neq 0\),则
当 \(x'(t)\) 与上述行列式同号时,曲线下凸,否则上凸。当 \(y'(t)\) 与上述行列式同号时,曲线右凸,否则左凸(\(x, y\) 交换身份,行列式变号)。
曲线的 拐点 定义为平面曲线上凸性发生转换的点。
若 \(f''(x)\) 在 \(x ^ *\) 处变号,则 \(f'\) 单调性发生改变,\(x ^ *\) 是 \(y = f(x)\) 的拐点。因此在 \(y = f(x)\) 的拐点 \(x ^ *\) 处若存在二阶导数,则 \(f''(x ^ *) = 0\)(\(f''\) 是 \(f'\) 的导函数,有介值性)。
不等式
Jesen 不等式
设 \(f\) 是区间 \(I\) 上的凸函数,则对任意 \(x_1, x_2, \cdots, x_n \in I\) 以及任意正数 \(t_1, t_2, \cdots, t_n\),
若 \(f\) 严格凸,则等号成立当且仅当所有 \(x_i\) 相等。对 \(n\) 做数学归纳法易证。
例 \(5\)
设 \(a_1, a_2, \cdots, a_n > 0\) 不全相同,证明
\[f(x) = \left(\frac {\sum a_i ^ x} n\right) ^ \frac 1 x \]是严格增函数。
证明
任取 \(0 < x_1 < x_2\),则 \(f(x_1) < f(x_2)\) 当且仅当
\[\left(\frac {\sum b_i} n\right ) ^ t\leq \frac {\sum b_i ^ t} n \]其中 \(t = \frac {x_2} {x_1}\),\(b_k = a_k ^ {x_1}\)。后者是 \(x ^ t\ (x > 0, t > 1)\) 的 Jesen 不等式,而 \(x ^ t\) 严格凸。
对于 \(x_1 < x_2 < 0\),类似证明 \(f(x_1) < f(x_2)\)。
当 \(x\to 0\) 时
\[\bal \ln f(x) & = \fr 1 x\ln\l(\fr {a_1 ^ x + \cdots + a_n ^ x} {n}\r) \\ & = \frac 1 x \ln(1 + x \fr {\ln a_1 + \cdots + \ln a_n} n + o(x)) & \l(a ^ x = 1 + x\ln a + o(x),\ x\to 0\r) \\ & = \fr {\ln a_1 + \cdots + \ln a_n} {n} + o(1) \eal \]因此 \(f(x)\to \sqrt [n]{a_1a_2\cdots a_n}\)(几何平均),以它作为 \(f(0)\) 的函数值,则 \(f\) 连续。\(\square\)
例 \(6\)
设 \(p_1 + p_2 + \cdots + p_n = q_1 + q_2 + \cdots + q_n = 1\)。证明 \(\sum p_i\ln q_i\leq \sum p_i\ln p_i\)。
证明
左式减去右式,根据 \(\ln\) 为凹函数使用 Jesen 不等式得
\[\sum p_i \ln \frac {q_i} {p_i} \leq \ln(\sum p_i\frac {q_i} {p_i}) = 0 \]\(\square\)
\(-\sum p_i\ln p_i\) 称为离散概率分布的 熵,它是某种情况发生时其概率 \(P\) 的 \(-\ln P\) 的期望值。\(n\) 个取值的离散分布的最大熵为 \(\ln n\)。
概率为 \(0\leq p \leq 1\) 的事件发生时带来的惊喜程度为 \(S(p)\),有
- \(S(1) = 0\)(必然事件不产生惊喜),\(S(0) = +\infty\)(不可能事件欣喜若狂)。
- \(S(p_1p_2) = S(p_1) + S(p_2)\)(两个独立事件同时发生,喜上加喜)。
- \(S(p)\) 关于 \(p\) 单调减。
根据以上要求,\(S(p) = -C\ln p\),规范化取 \(C = 1\)。
Holder 不等式
对正数 \(a_1, \cdots, a_n; b_1, \cdots, b_n\) 以及 \(p, q: \frac 1 p + \frac 1 q = 1\),有
\(p = q = 2\) 是 Cauchy-Schwarz 不等式。
证明
记 \(c_k = \fr{b_k}{a_k ^ {p - 1}}\),则
\[\fr {\sum a_kb_k} {\sum a_k ^ p} = \fr {\sum a_k ^ p (c_k ^ q) ^ {\fr 1 q}} {\sum a_k ^ p} \leq \l(\fr {\sum a_k ^ p c_k ^ q} {\sum a_k ^ p}\r) ^ {\fr 1 q} = \l(\fr {\sum b_k ^ q} {\sum a_k ^ p}\r) ^ {\fr 1 q} \]因此
\[\sum a_k b_k \leq \l(\sum a_k ^ p\r) ^ {1 - \fr 1 q} \l( \sum b_k ^ q\r) ^ {\fr 1 q} = \l(\sum a_k ^ p\r) ^ {\fr 1 p} \l(\sum b_k ^ q \r) ^ {\fr 1 q} \]\(\square\)
Minkowski 不等式
对正数 \(a_1, \cdots, a_n; b_1, \cdots, b_n\) 以及 \(p\geq 1\),有
\(p = 2\) 是 \(\R ^ n\) 中的三角形不等式。
证明
记 \(t = \left(\sum_{k = 1} ^ n a_k ^ p\right) ^ {\frac 1 p}\),\(s = \left(\sum_{k = 1} ^ n b_k ^ p\right) ^ {\frac 1 p}\),\(u_k = \frac {a_k ^ p} {t ^ p}\),\(v_k = \frac {b_k ^ p} {s ^ p}\),则 \(\sum_{k = 1} ^ n u_k = \sum_{k = 1} ^ n v_k = 1\)。
要证明的不等式等价于
\[\sum_{k = 1} ^ n\left(\frac {u_k ^ {1 / p}t + v_k ^ {1 / p}s} {t + s}\right) ^ p \leq 1 \]使用 Jesen 不等式即得。\(\square\)
Legendre 变换
设 \(f\) 是区间 \(I\) 上的可微严格凸函数,于是 \(J = f'(I)\) 是区间且 \(f'\) 严格单调。
\(\forall u\in J\),存在唯一的 \(x_u\) 使得 \(f'(x_u) = u\),于是 \(f(x) \geq f(x_u) + u(x - x_u)\)。
记 \(g(u) = \sup(xu - f(x)) = ux_u - f(x_u)\),称 \(g: J\to \R\) 为 \(f\) 的 Legendre 变换。则
\(g(u)\) 为对应切线在 \(y\) 轴截距的相反数。
例 \(7\)
设 \(p > 1\),求 \(f(x) = \frac {x ^ p} p\) 的 Legendre 变换。
解
\(f'(x) = x ^ {p - 1}\) 的值域为 \((0, +\infty)\),对任意 \(u > 0\),由 \(f'(x) = u\) 解得 \(x_u = u ^ {\fr 1 {p - 1}}\)。
于是 \(g(u) = u ^ {\fr {p} {p - 1}} - \fr {u ^ {\fr p {p - 1}}} {p} = \fr {u ^ q} q\),其中 \(q = \fr p {p - 1}\)。可知 \(q > 0\) 且 \(\frac 1 p + \frac 1 q = 1\),得到 Young 不等式
\[\frac {x ^ p} {p} + \frac {u ^ q} {q} \geq ux,\ \forall x, u > 0 \]
111 L' Hopital 法则与 Taylor 公式
内容:
- L' Hopital 法则。
- Taylor 公式。
- Taylor 公式的应用。
主要是在求未定型极限方面的应用。
L' Hopital 法则
不定型极限
引入无穷大和无穷小时,一些关于它们的四则运算不成立,如 \(\fr {\infty} {\infty}, \fr {o(1)} {o(1)}, \infty \cdot o(1), \infty - \infty, o(1) ^ {o(1)}, \infty ^ {o(1)}\)。这些运算大都可以归结到计算形如 \(\frac {o(1)} {o(1)}\) 的极限。
L' Hopital \(\frac {o(1)} {o(1)}\)
设 \(f(x) = o(1),\ x\to a\),\(g(x) = o(1),\ x\to a\),\(g'(x) \neq 0\)。若
则 \(\lim_{x\to a} \frac {f(x)} {g(x)} = A\)。其中 \(a\) 可以是无穷远。
证明
Cauchy 中值定理。
L' Hopital \(\frac {\mathrm{something}} {\infty}\)
设 \(g(x)\to \infty,\ x\to a\),\(g'(x) \neq 0\)。若
则 \(\lim_{x\to a} \frac {f(x)} {g(x)} = A\)。
若 \(f\) 有界,则极限为 \(0\)。注意 \(f\) 无界 \(\neq\) \(f\to +\infty\),\(f\) 可以来回震荡。趋于无穷一定无界,无界不一定趋于无穷。
证明
不妨设 \(\lim_{x\to a ^ -} g(x) = +\infty\),\(g'(x) > 0\)。任取 \(A_1 < A_3 < A < A_4 < A_2\),存在 \(a\) 的去心邻域 \(W\) 使得对任意 \(x\in W\),\(\fr {f'(x)} {g'(x)} \in (A_3, A_4)\),于是 \(f - A_4g\) 严格减,\(f - A_3g\) 严格增。
任取 \(x_1 \in W\),存在 \(a\) 的去心邻域 \(W_1\) 使得 \(W_1\subseteq (x_1, a)\) 且 \(\forall x\in W_1\),
\[\bal f(x) - A_4g(x) < f(x_1) - A_4g(x_1) < (A_2 - A_4) g(x) \to +\infty \\ f(x) - A_3g(x) > f(x_1) - A_3g(x_1) > (A_1 - A_3) g(x) \to -\infty \eal \]从而 \(A_1 < \fr {f(x)} {g(x)} < A_2\)。因此 \(\lim_{x\to a ^ -} \fr {f(x)} {g(x)} = A\)。\(\square\)
例 \(1\)
设 \(\alpha > 0\),求 \(\lim_{x\to +\infty} \fr {\ln x} {x ^ \a}\)。
解
当 \(x\to +\infty\) 时,\(x ^ \a\to 0\)。于是
\[\lim_{x\to +\infty} \fr {\ln x} {x ^ \a} = \lim_{x\to +\infty} \fr {1} {\a x ^ \a} = 0 \]
若右侧极限存在,则左侧极限存在且与右侧极限相等。需要验证使用前提 \(\fr {o(1)} {o(1)}\) 或 \(\fr {\rm {something}} {\infty}\)。
例 \(2\)
求 \(\lim_{x\to 0} \fr {\e ^ {-\fr 1 {x ^ 2}}} x\)。
解
直接 L' Hopital 无法求出结果,需要换元。可根据 \(\e ^ x > x\) 放缩求出答案为 \(0\)。
Stolz 定理
对数列 \(\{a_n\}, \{b_n\}\):
- 设 \(b_n\) 严格递增且 \(\lim_{n\to +\infty} b_n = +\infty\),若 \(\lim_{n\to +\infty} \frac {a_n - a_{n - 1}} {b_n - b_{n - 1}} = A\),则 \(\lim_{n\to +\infty} \frac{a_n} {b_n} = A\)。
- 设 \(b_n\) 严格递减且 \(\lim_{n\to +\infty} b_n = \lim_{n\to +\infty} a_n = 0\),若 \(\lim_{n\to +\infty} \frac {a_n - a_{n - 1}} {b_n - b_{n - 1}} = A\),则 \(\lim_{n\to +\infty} \frac{a_n} {b_n} = A\)。
几何证明思路:将 \((a_n, b_n)\) 看成平面上的点。
离散的 L' Hopital 法则。
导数极限定理(部分)
设 \(f : [a, b]\to \R\) 连续,在 \((a, b)\) 内可导,且 \(\lim_{x\to a ^ +} f'(x) = A\in \R\),则 \(f\) 在 \(x = a\) 处右侧可导且 \(f_+'(a) = A\)。
证明
\[f_+'(a) = \lim_{x\to a ^ +} \frac {f(x) - f(a)} {x - a} \]对等式右侧的极限使用 L' Hopital 法则即可。\(\square\)
导函数没有可去间断点(Darboux 定理)。
Taylor 公式
Taylor 多项式
设 \(f\) 在 \(x_0\) 处有 \(n\) 阶导数,称
为 \(f\) 在 \(x_0\) 处的 \(n\) 阶 Taylor 多项式。用简单的函数(多项式)逼近任意函数。
Peano 余项
设 \(f\) 在 \(x_0\) 处有 \(n\) 阶导数,则 \(n\) 阶多项式 \(P_n(h)\) 满足
当且仅当 \(P_n\) 为 \(f\) 在 \(x_0\) 处的 \(n\) 阶 Taylor 多项式。
证明
\(n = 1\) 易证(注意:充分性和必要性都需要证明)。假设 \(n\) 时结论成立,\(f\) 在 \(x_0\) 处 \(n + 1\) 阶可微。
设 \(F(h) = f(x_0 + h) - Tf_{x_0, n}(h)\),\(G(h) = \frac {h ^ {n + 1}}{(n + 1)!}\),则 \(\forall k\in [0, n]\),\(F ^ {(k)}(0) = G ^ {(k)}(0) = 0\)。当 \(h\to 0\) 时
\[\frac {F(h)} {G(h)} = \frac {F(h) - F(0)} {G(h) - G(0)} = \frac {F'(h_1)} {G'(h_1)} = \cdots = \frac {F ^ {(n)}(h_n)} {G ^ {(n)}(h_n)} = \frac {F ^ {(n + 1)}h_n + o(h_n)} {G ^ {(n + 1)}h_n + o(h_n)} \to f ^ {(n + 1)}(x_0) \]其中 \(0 < h_n < h_{n - 1} < \cdots < h_0 = h\),前 \(n\) 步使用了 Cauchy 中值定理,最后一步是微分的定义。
- 最后一步不能使用微分中值定理,没有保证 \(F ^ {(n)}\) 在 \((0, h_n)\) 内可导。
剩下的处理是容易的。\(\square\)
定理保证了 Taylor 展开的唯一性。
注:高阶可微性的条件至关重要。考虑 \(g(x) = \begin{cases} \e ^ {-\frac 1 {x ^ 2}} & x\in \R \bs \Q \\ 0 & x\in \Q \end{cases}\)。对任意正整数 \(n\),\(g(x) = o(x ^ n),\ x\to 0\),但 \(g(x)\) 只在 \(x = 0\) 处可微,没有高阶导函数,也没有对应的高阶 Taylor 多项式。因此,存在 \(P(h)\) 满足 \(f(x_0 + h) = P(h) + o(h ^ n),\ h\to 0\) 并不蕴含 \(f\) 有相应的高阶可微性,也不蕴含 \(P\) 是 \(f\) 在 \(x_0\) 处的 Taylor 多项式。
注:\(f\mapsto Tf_{x_0, n}\) 不是单射。\(g(x) = \begin{cases} \e ^ {-\frac 1 {x ^ 2}} & x\neq 0 \\ 0 & x = 0 \end{cases}\) 是 \(\mathscr{C} ^ {\infty}\) 函数,它与恒为零的函数具有相同的任意阶 Taylor 多项式。\(f(x)\) 和 \(f(x) [1 + g(x)]\) 在 \(x = 0\) 处有相同的任意阶 Taylor 多项式。
Lagrange 余项
设 \(f\) 在区间 \(I\) 上连续,在区间 \(I\) 内 \(n + 1\) 阶可微,则对 \(I\) 的任何内点 \(x_0\) 以及任意 \(x\in I\),都存在严格介于 \(x, x_0\) 之间使得
\(n = 0\) 时为 Lagrange 余项。
证明和 Peano 余项类似,最后一步将微分定义改成 Cauchy 中值定理。
Lagrange 余项要求更强的条件:在 \(I\) 内 \(n + 1\) 阶可微远强于 Peano 余项的在 \(x_0\) 处 \(n\) 阶可微。它得到的结论更强,同时刻画了函数在区间 \(I\) 上的整体性质,而 Peano 余项只是在 \(x_0\) 一点附近的性质,此时 Lagrange 余项较为精确地表示了 \(h ^ {n + 1}\) 前的系数。
- 微分中值定理的作用:将离得很远的函数值用导数连接在一起。
- Peano 余项的 Taylor 公式只在极限过程中成立,是局部性质,常用于渐进展开,求极限;Lagrange 余项 Taylor 公式在整个区间上成立,是整体性质,常用于误差分析。
基本初等函数的泰勒公式(一)
根据函数之间的求导关系,它们的 Taylor 多项式之间也有联系。设 \(F\) 是 \(f\) 的一个 原函数:\(F'(x) = f(x)\),则
已知 \(F, f\) 中任何一个函数的 Taylor 多项式,可求出另一个函数的 Taylor 多项式。
基本初等函数的泰勒公式(二)
由 \((\sin x)' = \cos x\) 和 \(\sin\) 在 \(x = 0\) 处的 Taylor 展开可知
由 \((\ln (1 + x))' = \frac 1 {1 + x}\),\(\ln (1 + 0) = 0\) 和 \((1 + x) ^ {-1}\) 在 \(x = 0\) 处的 Taylor 展开可知
由 \((\arctan x)' = \frac 1 {1 + x ^ 2}\),\(\arctan 0 = 0\) 和 \((1 + x ^ 2) ^ {-1}\) 在 \(x = 0\) 处的 Taylor 展开可知
由 \((\arcsin x)' = (1 - x ^ 2) ^ {-\frac 1 2}\),\(\arcsin 0 = 0\) 和 \((1 - x ^ 2) ^ {-\frac 1 2}\) 在 \(x = 0\) 处的 Taylor 展开可知
注意区分在 \(x = 0\) 处展开的 Taylor 多项式在 \(x_0\) 附近的取值,和在 \(x = x_0\) 处展开的 Taylor 多项式在 \(0\) 附近的取值。
偶函数在 \(x = 0\) 处的 Taylor 展开只含偶次项。奇函数在 \(x = 0\) 处的 Taylor 展开只含奇次项。
112 Taylor 公式的计算与应用
内容:
- Taylor 公式的计算。
- Taylor 公式的应用。
计算
计算 Taylor 展开式的办法:
- 按定义求导。
- 利用 \(T (f')_{x_0, n}(h) = (Tf_{x_0, n + 1})'(h)\) 逐项求导。
- 利用 Peano 余项 Taylor 公式的唯一性间接展开:四则运算,复合,待定系数。
应用
求极限
尽量使用 Taylor 公式,因为求导的计算量较大。
例 \(1\)
\[\lim_{x\to 0} \frac {x \cos x - \sin x} {x ^ 3} \]解
分母是三阶,所以分子也要展开到三阶。
\[f(x) = \frac {x(1 - \frac 1 2x ^ 2 + o(x ^ 2)) - (x + \frac 1 6x ^ 3 + o(x ^ 3))} {x ^ 3} = -\frac 1 3 + o(1), \quad x\to 0 \]
先通过分析主项确定分子和分母的展开阶数。
例 \(2\)
\[\lim_{x\to 0} \left(\frac {\sin x} x \right) ^ {\frac 1 {x ^ 2}} \]解
设 \(f(x) = \e ^ {g(x)}\)。
\[g(x) = \frac {\ln(\frac{x - \frac {x ^ 3} 6 + o(x ^ 3)} x)} {x ^ 2} = \frac {\ln(1 - \frac {x ^ 2} 6 + o(x ^ 2))}{x ^ 2} = \frac {-\frac {x ^ 2} 6 + o(x ^ 2)} {x ^ 2} \to -\frac 1 6,\quad x\to 0 \]极限为 \(\e ^ {-\frac 1 6}\)。
例 \(3\)
\[\lim_{x\to 1} \left( \frac {x} {x - 1} - \frac {1} {\ln x}\right) \]解
设 \(x = 1 + t\),则
\[f(x) = \fr {1 + t} t - \fr{1}{\ln(1 + t)} = 1 + \fr {\ln(1 + t) - t} {t\ln(1 + t)} = 1 + \fr {t - \fr 1 2 t ^ 2 + o(t ^ 2) - t} {t(t + o(t))} \to \fr 1 2, \quad t\to 0 \]
尽量换元至 \(x = 0\) 处展开。
例 \(4\)
\[\lim_{x\to 0 ^ +} = \frac {\ln \cot x} {\ln x} \]解
\[f(x) = \fr {\ln(\cos x) - \ln(\sin x)} {\ln x} = \fr {o(1) - \ln(x(1 + o(1)))} {\ln x} \to -1, \quad x\to 0 ^ + \]
例 \(5\)
\[\lim_{x\to 0} \e ^ {-x} \left(1 + \frac{1} {x}\right) ^ {x ^ 2} \]解
设 \(f(x) = \e ^ {g(x)}\),则
\[g(x) = x ^ 2 \ln(1 + \fr 1 x) - x = \left(x - \fr 1 2 + o(1)\right) - x \to -\fr 1 2, \quad x\to +\infty \]极限为 \(\e ^ {-\fr 1 2}\)。
不可以先对一部分 \(x\) 取极限,再对另一部分 \(x\) 取极限。
求渐进展开
例 \(6\)
\(x_{n + 1} = \sin x_n\),求 \(x_n\) 的渐进展开式。
解
猜测 \(x_n\approx\frac {A} {n ^ {\alpha}}\),根据 \(x_{n + 1} = \sin x_n\) 和 \(x_n - x_{n + 1} \approx \frac {A} {n ^ {\alpha}} - \frac A {(n + 1) ^ {\alpha}}\) 解得 \(\alpha = \frac 1 2\),\(A = \sqrt 3\)。
证明 \(x_n = \sqrt {\frac 3 n}(1 + o(1))\),即计算 \(\lim_{n\to +\infty} nx_n ^ 2 = 3\)。使用 Stolz 定理和 Taylor 展开。
例 \(7\)
用圆内接正多边形周长求圆周率的近似值。
解
圆内接正 \(3\cdot 2 ^ n\) 边形的周长为
\[L_n = 3\cdot 2 ^ {n + 1} \sin \frac {2\pi}{3\cdot 2 ^ {n + 1}} = 2\pi - \frac {\pi ^ 3} {27 \cdot 2 ^ {2n}} + o\left(\frac {1} {2 ^ {2n}}\right) \]误差是 \(O\left(\frac 1 {2 ^ {2n}}\right)\) 级别。考虑到
\[L_{n + 1} = 2\pi - \fr {\pi ^ 3} {27\cdot 2 ^ {2n + 2}} + o\left(\fr 1 {2 ^ {2n}}\right) \]于是
\[(1 - \la)L_n + \la L_{n + 1} = 2\pi - \fr {\pi ^ 3}{27 \cdot 2 ^ {2n + 2}} (4 - 3\la) + o\left(\fr 1 {2 ^ {2n}}\right) \]取 \(\lambda = \frac 4 3\),则 \(L'_n = (1 - \lambda)L_n + \lambda L_{n + 1} = 2\pi + o(\frac 1 {2 ^ {2n}})\)。这种技巧称为 外推修正。
平面曲线的曲率圆
取切线为 \(x\) 轴,法线为 \(y\) 轴,使正则曲线局部为 \(y = f(x) = ax ^ 2 + o(x ^ 2)\)(\(a > 0\))。
- 曲线与 \(y\) 轴相切,所以 \(y'_t = 0\)。于是 \(x'_t \neq 0\),\(x, t\) 之间有可微反函数关系,于是 \(y\) 在局部可以写成关于 \(x\) 的函数。
- 写成 \(ax ^ 2 + o(x ^ 2)\) 的原因:在原点处 \(y = y' = 0\),于是 Taylor 展开后最高项为二次项。
在 \(x = 0\) 处的曲率
曲率圆
取曲率圆过原点的一段
所以曲线和曲率圆 二阶相切(其它圆是一阶相切)。
估计 Newton 法的误差
设 \(f(x ^ *) = 0\),则
而 \(|x_n - \xi| \leq |x_n - x ^ *|\),于是 \(|x_{n + 1} - x ^ *|\leq \frac {M} m |x_n - x ^ *| ^ 2\),其中 \(M\) 是 \(|f''|\) 在 \([a, b]\) 上的最大值,\(m\) 是 \(|f'|\) 在 \([a, b]\) 上的最小值。
这说明 Newton 迭代是 二阶收敛 的,且在 \(x ^ *\) 附近收敛极快。
\(\e ^ x\) 的无穷级数
将 \(\e ^ x\) 在 \(x = 0\) 处展开,得到幂级数
无穷求和定义为部分和的极限。
限定 \(x\) 在有界范围内:\(\forall M\in \N ^ *\),\(\forall x\in [-M, M]\),存在 \(\xi\in [0, x]\) 使得
所以
对 \(N \geq 2M\)
于是 \(\lim_{N\to +\infty} a_N = 0\),即 \(\lim_{N\to +\infty} \left(\sum_{k = 0} ^ N \frac {x ^ k} {k!}\right) = \e ^ x\)。
定义可以推广到复数:证明部分和收敛(Cauchy 收敛准则),将极限定义为 \(\e ^ z\)。
验证 \(\e ^ z \e ^ w = \e ^ {z + w}\)(不是严谨证明):
三角函数的无穷级数
将 \(\cos\) 和 \(\sin\) 展开得
以及
可以推出和差角公式。
求近似值
求 \(\ln 2\) 的近似值。
用 Lagrange 余项的 Taylor 公式在 \(x = 0\) 处展开 \(\ln(1 + x)\):
对 \(-\frac 1 2\leq x \leq 1\),有 \(\abs{\frac {x} {1 + \xi}} \leq 1\),所以
但是它收敛太慢,考虑
113 一个例子
考虑方程
a. 证明对任意 \(x\in \R\),上述方程关于 \(y\) 在区间 \([x, +\infty)\) 上有唯一解 \(y = f(x)\)。
- 这是由方程定义的隐函数,无法写出 \(y\) 关于 \(x\) 的表达式。
- WXF:教材上讲了怎么对隐函数求导,但放在一元微积分不合适。对一般的方程论证 \(x\) 唯一确定 \(y\),目前的知识不够。可以对特殊的方程论证。
证明
视 \(x\) 为参数,设 \(F_x(y) = xy + \e ^ x - \e ^ y\)。
由 \(F_x(x) = x ^ 2\geq 0\),\(F_x(+\infty) = -\infty\) 可知零点存在。
由 \(\frac {\d} {\d y} F_x(y) = x - \e ^ y \leq x - \e ^ x \leq -1 < 0\) 可知零点唯一。\(\square\)
b. 证明 \(f: \R \to \R\) 是 \(\mathscr C ^ {\infty}\) 函数。
证明
连续性
对任意 \(x_0\),记 \(y_0 = f(x_0)\),则 \(y_0\geq x_0\)。
当 \(x_0\neq 0\) 时,\(y_0 > x_0\)。因为 \(F_x(y)\) 在 \(y\geq x\) 时连续且递减,所以对任意 \(x_0 < y_1 < y_0 < y_2\),\(F(y_1) > F(y_0) = 0 > F(y_2)\)。固定 \(y\) 时,\(F_y(x)\) 关于 \(x\) 连续,所以存在 \(\delta > 0\) 使得 \(x_0 + \delta < y_1\) 且 \(\forall |x - x_0| < \delta\),\(F_x(y_1) > 0 > F_x(y_2)\)。于是 \(y_1 < f(x) < y_2\)。
由 \(xf(x) + \e ^ x = \e ^ {f(x)} \geq 1 + f(x)\) 得到
\[x\leq f(x) \leq \fr {\e ^ x - 1} {1 - x} \implies \lim_{x\to 0} f(x) = 0 = f(0) \]因此 \(f : \R \to \R\) 连续。
可微性
记 \(u = f(x + h) - f(x)\),则
\[(x + h)(f(x) + u) + \e ^ {x + h} - \e ^ {f(x) + u} = 0 \]因为 \(f\) 连续,所以当 \(h\to 0\) 时,\(u\to 0\)。于是
\[xf(x) + hf(x) + xu + \e ^ x + \e ^ xh + o(h) - \e ^ {f(x)} - \e ^ {f(x)}u + o(u) = 0 \]即
\[u + o(u) = \fr {\e ^ x + f(x)} {\e ^ {f(x)} - x}h + o(h) \implies u = \fr {\e ^ x + f(x)} {\e ^ {f(x)} - x}h + o(h) \]因此 \(f : \R \to \R\) 可微,且导函数为 \(\fr {\e ^ x + f(x)} {\e ^ {f(x)} - x}\)。使用数学归纳法可证 \(f\) 任意阶可微,\(f\in \scr C ^ \infty\)。\(\square\)
c. 求 \(f(x)\) 在 \(x = 0\) 处的四阶 Taylor 展开式。
虽然不能写出 \(y\) 关于 \(x\) 的表达式,但可以 Taylor 展开得到近似表达式。
解
因为 \(y = f(x)\) 无穷阶可导,所以对 \(x\) 依次求导,得
\[\bal 0 & = y + xy' + \e ^ x - \e ^ yy' \implies y'(0) = 1 \\ 0 & = 2y' + xy'' + \e ^ x - \e ^ y((y') ^ 2 + y'') \implies y''(0) = 2 \\ 0 & = 3y'' + xy ^ {(3)} + \e ^ x - \e ^ y((y') ^ 3 + 3y'y'' + y ^ {(3)}) \implies y ^ {(3)}(0) = 0 \\ 0 & = 4y ^ {(3)} + xy ^ {(4)} + \e ^ x - \e ^ y((y') ^ 4 + 6(y') ^ 2y'' + 3(y'') ^ 2 + 4y'y ^ {(3)} + y ^ {(4)}) \implies y ^ {(4)}(0) = -24 \eal \]可知
\[y = x + x ^ 2 - x ^ 4 + o(x ^ 4),\quad x\to 0 \]
d. 讨论 \(f\) 的单调性,估计 \(f\) 的值域。
解
当 \(x\geq 0\) 时,\(f(x)\geq x \geq 0\),于是 \(\e ^ {f(x)} \geq \e ^ x \geq x + 1\),可知
\[f'(x) = \fr {\e ^ x + f(x)} {\e ^ {f(x)} - x} > 0 \]且 \(\lim_{x\to +\infty} f(x) = +\infty\)。
\(f'(x) = 0\) 当且仅当
\[\bc xy + \e ^ x - \e ^ y = 0 \\ \e ^ x + y = 0 \\ \ec \]由第二个方程知 \(x = \ln (-y)\),得 \(g(y) = y\ln(-y) - y - \e ^ y = 0\)。
由 \(y > x = \ln(-y)\) 可知 \(-1 < y < 0\),而 \(\lim_{y\to 0 ^ -} g(y) = -1\),\(g(-1) = 1 - \e ^ {-1} > 0\) 且 \(g'(y) = \ln(-y) - \e ^ y < 0\),根据连续性,上述方程有唯一解 \(\xi\)。又因为 \(f'(0) = 1 > 0\),所以 \(f\) 在 \([\xi, +\infty)\) 上严格增。
因为 \(-1 < y < 0\),所以若 \(\lim_{x\to -\infty} f(x)\neq 0\),则存在 \(\eps > 0\) 和 \(x_n\to -\infty\) 使得 \(f(x_n) < -\eps\)。而
\[\e ^ {-\eps} > \e ^ {-\eps} - \e ^ {x_n} \geq \e ^ {f(x_n)} - \e ^ {x_n} = x_nf(x_n) > -\eps x_n\to +\infty \]矛盾,所以 \(f\) 在 \((-\infty, \xi]\) 上严格减。
e. 讨论当 \(x\to -\infty\) 和 \(x\to +\infty\) 时的渐近线。
解
由 \(\lim_{x\to -\infty} f(x) = 0\) 知 \(x\to -\infty\) 时的渐近线为 \(y = 0\)。
分析 \(F\) 可知对充分大的 \(x\),\(x < f(x) < 2x\)。设 \(u = f(x) - x\),则 \(0 < u < x\),且
\[0 = x(x + u) + \e ^ x - \e ^ x \e ^ u \leq 2x ^ 2 + \e ^ x(1 - \e ^ u) \leq 2x ^ 2 - \e ^ xu \implies u\to 0,\; x\to +\infty \]所以 \(x\to +\infty\) 时的渐近线为 \(y = x\)。
114 不定积分的概念与计算
不定积分是求导的逆运算,属于微分学。Newton-Leibniz 公式将求导的逆运算和求面积联系在一起。
内容:
- 不定积分与原函数的概念。
- 不定积分计算技巧。
- 有理函数不定积分。
- 沿代数曲线的不定积分。
相关概念
原函数
称 \(F\) 是 \(f\) 在 \(I\subseteq \R\) 上的一个 原函数,若
若 \(F\) 是原函数,则 \(F + C\) 也是原函数,其中 \(C\) 是任意常数。
不定积分
\(f\) 在 \(I\subseteq\R\) 上的 不定积分 是 \(f\) 在 \(I\) 上的 全体 原函数。记为
记号里写 \(\d x\):明确对哪个变量求积分,使得换元公式和分部积分公式容易记忆,体现积分是微分的逆运算。
求导和求原函数:\(F(x)\to f(x)\to F(x)\)。微分和积分:\(F(x)\to f(x)\d x \to F(x)\)。
定理
若 \(I\subseteq\R\) 是区间,\(F_1, F_2\) 是 \(f\) 在 \(I\) 上的原函数,则 \(F_1(x) - F_2(x)\) 是常数。
\[\int f(x) \d x = \int \d F(x) = F(x) + C \]证明
由 Lagrange 中值定理,区间上只有常函数的导数恒为 \(0\)。\(\square\)
常见函数的原函数
其中双曲正弦 \(\sinh x = \fr {\e ^ x - \e ^ {-x}} 2\),双曲余弦 \(\cosh x = \fr {\e ^ x + \e ^ {-x}} 2\),为双曲线意义下的三角函数。
\(\cosh ^ 2 x - \sinh ^ 2 x = 1\),恰好是双曲线的方程。
运算性质
求积分需要更多经验和观察。
定理(线性)
若 \(F, G\) 分别是 \(f, g\) 在 \(I\) 上的原函数,则 \(\lambda F + \mu G\) 是 \(\lambda f + \mu g\) 的原函数。
特殊规定
例 \(1\)
计算
\[\int \fr {1} {(x - a) (x - b)} \d x \]解
利用线性性将二次式化为一次式。
\[\bal & \int \fr {1} {(x - a) (x - b)} \d x \\ = \; & \int \fr {1} {a - b} \left[\fr {1} {x - a} - \fr 1 {x - b} \right]\d x \\ = \; & \fr {1} {a - b} \left[\ln \abs {x - a} - \ln \abs {x - b}\right] + C \eal \]
例 \(2\)
计算
\[\int \fr {1} {(x - a) (x - b) ^ 2} \d x \]解
利用线性性做 部分分式分解。
\[\bal & \int \fr {1} {(x - a) (x - b) ^ 2} \d x \\ = \; & \int \left[\fr {A_1} {x - a} + \fr {A_2} {x - b} + \fr {A_3} {(x - b) ^ 2} \right]\d x \\ = \; & A_1 \ln \abs {x - a} + A_2 \ln \abs {x - b} + \fr {A_3} {x - b} + C \eal \]
结合 直接代入 和 待定系数法 确定 \(A_1, A_2, A_3\):
- 代入 \(x = a\) 解得 \(A_1 = \fr {1} {(a - b) ^ 2}\)。
- 代入 \(x = b\) 解得 \(A_3 = \fr {1} {b - a}\)。
- 比较 \(x ^ 2\) 的系数得到 \(A_2 = -A_1 = -\fr {1} {(a - b) ^ 2}\)。
通分后先不要展开,代入特殊值解方程可以有效减少计算量。
定理(换元)
若 \(F, G\) 分别是 \(f, g\) 的原函数,则
第一类换元法(凑微分)
第二类换元法(主动换元)
其中 \(H(x)\) 是 \(f(G(x)) g(x)\) 的原函数。第二类换元法要求换元函数 \(x = \varphi(u)\) 严格单调(以确保有反函数)且可导。
例 \(3\)
计算
\[\int \fr {x} {1 + x ^ 2} \d x \]解
凑微分
\[\int \fr {x} {1 + x ^ 2} \d x = \fr 1 2\int \fr {1} {1 + x ^ 2}\d (1 + x ^ 2) = \fr 1 2 \ln (1 + x ^ 2) + C \]
例 \(4\)
计算
\[\int \sin ^ nx \cos ^ mx \d x \]其中 \(n, m\) 至少有一个是奇数。
解
设 \(m > 0\) 是奇数,根据 \(\cos ^ 2 x = 1 - \sin ^ 2 x\) 将积分写成 \(\int f(\sin x) \cos x \d x\),其中 \(f\) 是多项式。
凑微分
\[\int f(\sin x) \cos x\d x = \int f(\sin x) \d \sin x \]对 \(m < 0\) 类似处理,得到有理分式积分。
当 \(n, m\) 均为偶数时,积分较复杂。
例 \(5\)
\[\int \fr {1} {\cos ^ {2m} x} \d x \]解
\[1 + \tan ^ 2 x = \sec ^ 2 x \]凑微分,\(\fr {\d x} {\cos ^ 2 x}\) 写成 $ \d \tan x$,剩下 \(\fr {1}{\cos ^{2m - 2} x}\) 写成 \((1 + \tan ^ 2 x) ^ {m - 1}\)。
例 \(6\)
\[\int \tan ^ n x \d x \]解
主动换元,设 \(t = \tan x\),则 \(x = \arctan t\)。
\[\int \tan ^ n x \d x = \int t ^ n \d \arctan t = \int \fr {t ^ n} {1 + t ^ 2} \d t \]
例 \(7\)
\[\int \fr 1 {\sqrt {x ^ 2 + a ^ 2}} \d x \]解(三角换元)
设 \(x = a\tan \t\)(动机:\(1 + \tan ^ 2x = \sec ^ 2 x\)),则
\[\int \fr {1} {\sqrt {a ^ 2\tan ^ 2 \t + a ^ 2}} \d a \tan\t = \int \sec \t \d \t \]得到 \(\fr 1 2\ln \fr {1 + \sin \t} {1 - \sin \t}\),再用 \(\t = \arctan x\) 换成关于 \(x\) 的函数。
画三角形计算三角函数和反三角函数的代换,结果为 \(\ln(x + \sqrt {a ^ 2 + x ^ 2}) + C\)。
解(双曲换元)
设根式为 \(y\),则 \(y ^ 2 = x ^ 2 + a ^ 2\)。双曲线,使用双曲换元。设 \(x = a\sinh t\),则
\[\int \fr {1} {\sqrt {a ^ 2\sinh ^ 2 t + a ^ 2}} \d a \sinh t = \int \fr {\cosh t} {\cosh t} \d t = t + C \]求反双曲正弦的表达式:注意到
\[\l(\fr x a\r) ^ 2 = \sinh ^ 2 t = \l(\fr {\e ^ t - \e ^ {-t}} 2\r) ^ 2 = \l(\fr {\e ^ t + \e ^ {-t}} 2\r) ^ 2 - 1 \]所以
\[\e ^ t = \sinh t + \cosh t = \fr x a + \sqrt {1 + \fr{x ^ 2} {a ^ 2}} \implies t = \ln (x + \sqrt {a ^ 2 + x ^ 2}) - \ln a \]
类似计算
三角换元 \(x = a\sec \t\) 或双曲换元 \(x = a\cosh t\)。
定理(分部积分)
对应乘积求导的 Leibniz 公式。
\(f, g\) 的选择是关键。
例 \(8\)
\[\int x\e ^ x \d x \]解
通过求导使一部分变简单,选择多项式求导(作为 \(F\))。
\[\int x\e ^ x \d x = \int x \d \e ^ x = x \e ^ x - \int \e ^ x \d x = x \e ^ x - \e ^x + C \]
例 \(9\)
\[\int x \sin x \d x \]解
\[\int x \sin x \d x = -\int x \d \cos x = -x\cos x + \int \cos x\d x = \sin x - x \cos x + C \]
其中 \(Q\) 是次数不超过 \(P\) 的多项式。有 待定系数法
求导得
解得 \(a_2 = -1\),\(a_1 = 2a_2 = -2\),\(a_0 = -a_1 = 2\)。
例 \(10\)
\[\int x ^ {\alpha} \ln x\d x \]解
\[\bal & \int x ^ {\alpha} \ln x\d x \\ = \; & \fr {x ^ {\alpha + 1}} {\alpha + 1}\ln x - \fr {1} {\alpha + 1} \int x ^ {\alpha + 1} \d \ln x \\ = \; & \fr {x ^ {\alpha + 1}} {\alpha + 1} \ln x - \fr {x ^ {\alpha + 1}} {(\alpha + 1) ^ 2} + C \eal \]
例 \(11\)
\[\int \e ^ x \sin ^ n x \d x \]解
被积函数两部分求导均无法降次,但产生循环(\(\e ^ x \to \e ^ x \to \e ^ x \to \cdots\))。解法为做两次分部积分,解方程求递推式。
\[\bal I_n & = \int \e ^ x \sin ^ n x \d x \\ & = \e ^ x\sin ^ n x - \int \e ^ x \d \sin ^ nx \\ & = \e ^ x\sin ^ n x - n \int \sin ^ {n - 1} \cos x \d \e ^ x \\ & = \e ^ x\sin ^ n x - n \e ^ x \sin ^ {n - 1} x \cos x - n\int \e ^ x \d (\sin ^ {n - 1} \cos x) \\ & = \e ^ x(\sin ^ n x - n \sin ^ {n - 1}x \cos x) + n(n - 1) (I_{n - 2} - I_n) - nI_n \eal \]其中 \(I_1 = \frac {\e ^ x(\sin x - \cos x)} 2\)。
有理函数不定积分
部分分式分解
对有理函数 \(f(x) = \fr {P(x)} {Q(x)}\)(\(P, Q\) 是多项式),先用长除法让 \(\deg P < \deg Q\)(化为真分式),再将 \(f(x)\) 写成有限多个最简分式的线性组合(\(\R\) 上的 部分分式分解,有理函数积分的核心)。这需要将 \(Q(x)\) 因式分解为一次式和最简二次式的乘积(依赖于 代数学基本定理),再使用待定系数法计算每个最简分式的分子。
- \(\R\) 上的最简分式:\(\frac {1} {(x - a) ^ m}\),\(\frac {1} {[(x - p) ^ 2 + q ^ 2] ^ m}\),\(\frac {x} {[(x - p) ^ 2 + q ^ 2] ^ m}\)。
代数学基本定理
在 \(\C\) 中任何多项式至少有一个根。
证明思路
寻找使得 \(\abs {Q(z)}\) 最小的 \(z\)。
\(\abs{Q(z)}\) 关于 \(z\) 连续,且当 \(\abs {z} \to +\infty\) 时 \(\abs {Q(z)} \to +\infty\),所以存在 \(R > 0\) 使得当 \(\abs {z} > R\) 时 \(\abs {Q(z)} > \abs {Q(0)}\)。
在有界闭集 \(K = \{z\in \C | \abs {z} \leq \R\}\) 中 \(\abs {Q(z)}\) 有最小值 \(\abs {Q(z_0)}\leq \abs {Q(0)}\)。
假设 \(\abs {Q(z_0)} \neq 0\),令 \(P(z) = \fr {Q(z + z_0)} {Q(z_0)}\),则 \(\abs {P(0)} = 1\) 且 \(\abs {P(z)} \geq 1\)。设 \(m\) 为最小的 \(b_m\neq 0\)(\(P(z) = 1 + \sum_{m = 1} ^ n b_m z ^ m\)),则当 \(z\to 0\) 时,\(P(z) = 1 + b_mr ^ m\e ^ {im\t}(1 + o(1))\),这和 \(\abs {P(z)} \geq 1\) 矛盾。
对于实系数多项式,复根共轭出现。\(x - (a\i + b)\) 和 \(x - (a\i - b)\) 的乘积是实系数二次多项式,所以总可以将实系数多项式分解为一次式和最简二次式的乘积。
分解之后写出待定系数的最简分式
等式两侧同时乘以 \((x - a) ^ m\),代入 \(x = a\),右侧除 \(A_m\) 以外的所有项均为 \(0\),所以 \(A_m = \fr {P(a)} {\fr Q {(x - a) ^ m}(a)}\)。算出 \(A_m\) 后将 \(A_m\) 项移到左边,处理 \(A_{m - 1}\) 项,以此类推。对于平方项,代入 \(x = p + q \i\),比较实部和虚部得到两个等式,解出 \(B_n\) 和 \(C_n\)。
- 求因式分解的待定系数法:\(x ^ 4 + 1 = (x ^ 2 + px + q)(x ^ 2 + \alpha x + \beta)\),展开比较系数。
最简分式积分
\(\d x\) 写成 \(\d (x - a)\) 就可以直接积了。
\(x\d x\) 写成 \(\frac 1 2 \d (1 + x ^ 2)\) 就可以直接积了。
方法一:设 \(x = \tan \t\),则 \(\int \cos ^ {2m - 2} \t \d \t\)。二倍角公式降次,二项式展开,直到降为奇数次。次数高时较麻烦。
方法二:找递推关系
得到
求导比较系数。
例 \(12\)
计算
\[\int \frac {2x ^ 2 + 2x + 13} {(x - 2)(x ^ 2 + 1) ^ 2} \d x \]解
写成若干最简分式的和,系数待定。此时可以先不求系数,而是积分得到答案每一项的形式(系数待定),再求导确定系数。
例 \(13\)
计算
\[\int \fr {\d x} {x (x ^ 5 + 1)} \]解
\[I = \int \fr {\d x ^ 5} {5x ^ 5(x ^ 5 + 1)} = \frac 1 5\ln \abs {\fr {x ^ 5} {x ^ 5 + 1}} + C \]
每个问题都有自身的特殊性,普适的方法不一定最简单。
沿圆弧不定积分
其中 \(R(x, y) = \fr {P(x, y)} {Q(x, y)}\),\(P, Q\) 是二元多项式。
有理分式形式的圆周参数方程(万能公式)
万能公式的几何含义:从 \((-1, 0)\) 连线段到圆周上任意一点 \(P(x, y)\),记 \(t = \fr y{x + 1}\) 为连线斜率,则
\(t\) 是圆周角的斜率,圆周角是圆心角的一半,所以 \(t = \tan \fr \t 2\)。
换元 \(t = \tan \theta\)。
换元 \(t = \sin \t\)。
换元 \(t = \sin \t\) 或 \(t = \cos \t\)。
沿双曲线不定积分
或
有理分式形式的双曲线参数方程
于是
或者换成
沿可有理参数化代数曲线不定积分
需要能写成
将后面一坨换成 \(y\),写成有理函数积分。

浙公网安备 33010602011771号