9.4单步法的收敛性与相容性
单步法的收敛性与相容性 详细讲解与推导
各位同学,今天我们系统讲解常微分方程数值解中,单步法的收敛性与相容性这一核心知识点。我会从基础概念出发,完整推导每一个定理,拆解每一步的逻辑,最后用表格归纳核心结论,帮大家建立完整的知识体系。
一、前置知识铺垫
我们所有的讨论,都基于一阶常微分方程初值问题(IVP),标准形式为:
数值解法的核心思想,是将连续的微分方程离散为差分方程,通过递推计算离散点\(x_n = x_0 + nh\)(\(h\)为步长,\(n=0,1,2,\dots\))处的数值解\(y_n\),逼近真实解\(y(x_n)\)。
所有单步法都可以写成统一形式:
其中\(\varphi(x,y,h)\)称为增量函数,不同单步法的核心区别就是增量函数的形式:
- 欧拉法:\(\varphi(x,y,h) = f(x,y)\)
- 改进欧拉法:\(\varphi(x,y,h) = \frac{1}{2}\left[f(x,y) + f(x+h, y+hf(x,y))\right]\)
- 龙格-库塔法:多段斜率加权平均的增量函数
二、核心概念1:截断误差
数值解的误差分为两类,这是理解收敛性的基础,很多同学的困惑都源于对两类误差的混淆。
2.1 局部截断误差
定义:假设前一步的数值解完全准确,即\(y_n = y(x_n)\),用单步法计算得到的\(y_{n+1}\)与真实解\(y(x_{n+1})\)的差值,称为局部截断误差,记为\(T_{n+1}\):
p阶精度定义:若局部截断误差满足\(T_{n+1} = O(h^{p+1})\),则称该单步法具有p阶精度。
- 本质:单步计算产生的误差,是误差的“源头”,仅和方法本身的构造有关。
2.2 整体截断误差
定义:从初值\(y_0\)开始,经过\(n\)步递推计算得到的数值解\(y_n\),与真实解\(y(x_n)\)的差值,称为整体截断误差,记为\(e_n\):
- 本质:每一步的局部截断误差累积后的总误差,是我们最终关心的误差,直接决定数值解是否能逼近真实解。
三、核心概念2:收敛性
3.1 收敛性的定义
定义9.3 收敛性:若求解初值问题的单步法,对于固定的\(x_n = x_0 + nh\),当步长\(h \to 0\)(此时步数\(n = \frac{x_n - x_0}{h} \to \infty\))时,有\(y_n \to y(x_n)\),则称该方法是收敛的。
核心解读:
- 必须固定计算点\(x_n\):我们要验证的是“某一固定点的数值解,当步长无限缩小时,是否无限逼近真实解”;
- 收敛的等价表述:\(h \to 0\)时,整体截断误差\(e_n = y(x_n) - y_n \to 0\)。
3.2 单步法收敛性定理(定理9.3)与完整证明
这是单步法收敛性的核心定理,我们将完整推导每一步,不跳步、不省略逻辑。
定理完整表述
假设求解初值问题的单步法满足以下3个条件:
- 方法具有p阶精度,即局部截断误差\(T_{n+1} = O(h^{p+1})\);
- 增量函数\(\varphi(x,y,h)\)关于\(y\)满足利普希茨条件:存在与\(x,y,h\)无关的常数\(L_\varphi\)(利普希茨常数),使得
- 初值准确,即\(y_0 = y(x_0)\),初始误差\(e_0 = 0\)。
则该方法的整体截断误差满足:
(即方法收敛,且整体误差阶数等于方法的精度阶数)
详细证明过程
步骤1:拆分误差,建立局部与整体的联系
我们定义一个中间量\(\bar{y}_{n+1}\):假设第n步数值解完全准确(\(y_n = y(x_n)\))时,用单步法算出的第n+1步结果,即:
根据局部截断误差的定义,有:
由于方法具有p阶精度,因此存在与h无关的常数\(C>0\),使得:
步骤2:推导\(\bar{y}_{n+1}\)与实际数值解\(y_{n+1}\)的差值
实际递推得到的\(y_{n+1}\)为:
将两式相减,整理得:
两边取绝对值,由三角不等式\(|a+b| \leq |a| + |b|\),得:
步骤3:应用利普希茨条件化简
定理条件给出\(\varphi\)关于\(y\)满足利普希茨条件,代入(2)式的第二项:
将其代入(2)式,化简得:
步骤4:建立整体截断误差的递推不等式
我们的目标是\(e_{n+1} = y(x_{n+1}) - y_{n+1}\),将其拆分为两项:
再次应用三角不等式,结合(1)式和(3)式,得:
至此,我们得到了整体截断误差的核心递推关系。
步骤5:递推求解不等式,得到\(|e_n|\)的上界
已知初值准确,即\(e_0 = 0\),我们对(4)式进行逐次递推:
- \(n=0\):\(|e_1| \leq (1 + h L_\varphi)|e_0| + C h^{p+1} = C h^{p+1}\)
- \(n=1\):\(|e_2| \leq (1 + h L_\varphi)|e_1| + C h^{p+1} \leq C h^{p+1}\left[(1 + h L_\varphi) + 1\right]\)
- \(n=2\):\(|e_3| \leq (1 + h L_\varphi)|e_2| + C h^{p+1} \leq C h^{p+1}\left[(1 + h L_\varphi)^2 + (1 + h L_\varphi) + 1\right]\)
以此类推,递推\(n\)次后,得到等比数列求和形式:
由等比数列求和公式\(\sum_{k=0}^{n-1} q^k = \frac{q^n - 1}{q - 1}\),令\(q=1 + h L_\varphi\),则\(q-1 = h L_\varphi\),代入化简:
步骤6:估计\((1 + h L_\varphi)^n\)的上界
我们固定求解区间\([x_0, X]\),则对所有\(n\),有\(x_n - x_0 = nh \leq T\)(\(T = X - x_0\)为区间长度,是固定常数)。
这里用到一个基础不等式:对任意\(x \geq 0\),有\(1 + x \leq e^x\)(由\(e^x\)的泰勒展开\(e^x = 1 + x + \frac{x^2}{2!} + \dots \geq 1+x\)可证)。
令\(x = h L_\varphi \geq 0\),则\(1 + h L_\varphi \leq e^{h L_\varphi}\),两边取\(n\)次方:
结合\(nh \leq T\),得:
\(e^{T L_\varphi}\)是与\(h\)无关的常数,记为\(M = e^{T L_\varphi}\)。
步骤7:得到最终误差估计,定理得证
将(6)式代入(5)式,得:
令\(K = \frac{C (e^{T L_\varphi} - 1)}{L_\varphi}\)(\(K\)是与\(h\)无关的常数),则:
根据大O记号的定义,\(e_n = O(h^p)\),定理得证。
关键推论
当\(p \geq 1\)时,\(h \to 0\)必有\(h^p \to 0\),因此\(|e_n| \to 0\),即\(y_n \to y(x_n)\),方法收敛。
- 核心结论:满足定理条件的单步法,只要精度阶数\(p \geq 1\),就一定收敛。
四、核心概念3:相容性
4.1 相容性的定义
相容性描述的是:离散的差分方程,当步长\(h \to 0\)时,是否能还原为原始的微分方程,即差分方程与微分方程是否“兼容”。
定义9.4 相容性:若单步法的增量函数\(\varphi\)满足:
\[\varphi(x,y,0) = f(x,y) \]则称该单步法与初值问题相容。
核心解读:
我们将单步法的递推式变形为:
当\(h \to 0\)时,左边是函数\(y(x)\)在\(x_n\)处的导数\(y'(x_n) = f(x_n, y(x_n))\),因此右边的极限必须等于\(f(x,y)\),即\(\varphi(x,y,0) = f(x,y)\),这就是相容性的本质。
4.2 相容性与精度的关系定理(定理9.4)与证明
定理完整表述
具有p阶精度的单步法,与初值问题相容的充分必要条件是\(p \geq 1\)。
详细证明过程
我们先对局部截断误差做泰勒展开,这是证明的基础。
局部截断误差为:
- 对\(y(x_n + h)\)在\(x_n\)处做泰勒展开:
因此\(y(x_n + h) - y(x_n) = y'(x_n) h + \frac{y''(x_n)}{2} h^2 + O(h^3)\),而\(y'(x_n) = f(x_n, y(x_n))\)。
- 对\(\varphi(x_n, y(x_n), h)\)在\(h=0\)处做泰勒展开:
将两个展开式代入局部截断误差,整理得:
必要性证明(相容 ⇒ \(p \geq 1\))
若方法相容,由定义得\(\varphi(x,y,0) = f(x,y)\),因此(7)式中\(h\)的一次项系数为0,即:
根据p阶精度的定义,\(T_{n+1} = O(h^{p+1})\),因此\(p+1 \geq 2\),即\(p \geq 1\),必要性得证。
充分性证明(\(p \geq 1\) ⇒ 相容)
若方法具有p阶精度且\(p \geq 1\),则\(T_{n+1} = O(h^{p+1}) = O(h^2)\),说明(7)式中\(h\)的一次项系数必须为0(否则\(T_{n+1} = O(h)\),与\(p \geq 1\)矛盾),因此:
由定义,方法与初值问题相容,充分性得证。
五、收敛性与相容性的核心关系
结合定理9.3和定理9.4,我们可以得到常微分方程数值解中最核心的结论:
单步法收敛的充分必要条件:方法与初值问题相容,且增量函数\(\varphi(x,y,h)\)关于\(y\)满足利普希茨条件。
- 相容性是收敛的前提:不相容的方法,无论构造多复杂,都不可能收敛;
- 利普希茨条件是误差不发散的保障:保证每一步的局部误差不会被无限放大,最终累积误差可控。
六、实例验证
6.1 欧拉法的收敛性
欧拉法的增量函数\(\varphi(x,y,h) = f(x,y)\):
- 相容性:\(\varphi(x,y,0) = f(x,y)\),满足相容性定义,方法相容;
- 利普希茨条件:\(\varphi\)关于\(y\)的利普希茨条件,等价于\(f\)关于\(y\)的利普希茨条件;
- 精度:欧拉法是一阶精度(\(p=1\)),满足\(p \geq 1\)。
因此,当\(f\)关于\(y\)满足利普希茨条件时,欧拉法收敛。
6.2 改进欧拉法的收敛性
改进欧拉法的增量函数:
- 相容性:\(\varphi(x,y,0) = \frac{1}{2}[f(x,y) + f(x,y)] = f(x,y)\),满足相容性;
- 利普希茨条件:若\(f\)关于\(y\)满足利普希茨条件(常数为\(L\)),可推导出\(\varphi\)的利普希茨常数\(L_\varphi = L\left(1 + \frac{h_0}{2}L\right)\)(\(h \leq h_0\)),满足利普希茨条件;
- 精度:改进欧拉法是二阶精度(\(p=2\)),满足\(p \geq 1\)。
因此,改进欧拉法收敛。
七、核心知识点总结表格
| 核心概念 | 定义/数学表达 | 核心条件 | 核心结论 | 关键备注 |
|---|---|---|---|---|
| 局部截断误差 | \(T_{n+1}=y(x_{n+1})-[y(x_n)+h\varphi(x_n,y(x_n),h)]\) | 假设前一步数值解完全准确 | \(T_{n+1}=O(h^{p+1})\) ⇨ 方法具有p阶精度 | 单步计算的原生误差,决定方法的精度阶数 |
| 整体截断误差 | \(e_n = y(x_n) - y_n\) | 从初值开始n步递推的总误差 | \(e_n=O(h^p)\) ⇨ 整体误差与方法精度同阶 | 所有步局部误差的累积,决定数值解的准确性 |
| 收敛性 | 固定\(x_n=x_0+nh\),\(h \to 0\)时\(y_n \to y(x_n)\) | 1. 方法p阶精度,\(p\geq1\);2. \(\varphi\)关于\(y\)满足利普希茨条件;3. 初值准确 | 满足条件则方法收敛,\(e_n \to 0\) | 数值方法可用的核心判据,收敛的方法才有实际意义 |
| 相容性 | 增量函数满足\(\varphi(x,y,0)=f(x,y)\) | \(h \to 0\)时,差分方程还原为原微分方程 | 相容 ⇿ 方法精度\(p\geq1\) | 收敛的必要前提,不相容的方法一定不收敛 |
| 收敛与相容的关系 | 单步法收敛 ⇿ 方法相容 + \(\varphi\)满足利普希茨条件 | 区间有限,初值准确 | 相容是收敛的前提,利普希茨条件是误差可控的保障 | 单步法收敛性的核心准则,可直接用于判断方法是否收敛 |
单步法的绝对稳定性与绝对稳定域 详细讲解与推导
上一讲我们学习了单步法的收敛性,收敛性描述的是步长h→0时,数值解能否逼近真实解,但它的核心前提是计算过程完全准确、无舍入误差。而在实际工程计算中,舍入误差不可避免,我们更关心:固定步长h递推时,某一步的微小误差,会不会在后续计算中被无限放大,最终“淹没”真实的数值解——这就是稳定性问题,它是数值方法能否实际应用的核心判据。
一、稳定性的核心概念与背景
1.1 稳定性的严格定义与通俗理解
数值计算中,每一步的舍入误差都会作为“扰动”进入递推过程。如果扰动在后续计算中不增长、甚至逐步衰减,方法就是稳定的;如果扰动恶性增长导致数值解完全失真,方法就是不稳定的。
定义9.5 稳定性:若一种数值方法在节点值\(y_n\)上有大小为\(\delta\)的扰动,在之后所有节点\(y_m\)(\(m>n\))上产生的扰动的绝对值均不超过\(\delta\),则称该方法是稳定的。
1.2 实例引入:欧拉法的稳定与不稳定
我们用例9.4的初值问题直观理解稳定性:
该方程的精确解为\(y(x)=e^{-100x}\),是快速衰减的指数函数,原方程本身稳定。
用显式欧拉法求解,递推式为\(y_{n+1}=y_n + hf(x_n,y_n)\),代入\(f(x,y)=-100y\)得:
分两种步长测试:
- 步长h=0.025:递推式变为\(y_{n+1}=-1.5y_n\),解的绝对值每一步放大1.5倍,扰动同步放大,结果剧烈波动、完全失真,方法不稳定;
- 步长h=0.005:递推式变为\(y_{n+1}=0.5y_n\),解的绝对值每一步衰减一半,扰动同步衰减,方法稳定。
这个例子说明:单步法的稳定性,同时和方法本身、步长h、微分方程的性质有关。
1.3 模型方程的引入
为了剥离方法本身的属性,排除具体方程的干扰,我们统一用线性模型方程检验数值方法的稳定性:
其中\(\lambda\)为复数,且要求\(\text{Re}(\lambda) < 0\)。
选择该模型的核心理由
- 原方程稳定性:\(\text{Re}(\lambda) < 0\)时,模型方程的精确解\(y(x)=e^{\lambda x}\)是衰减的,原方程本身稳定,才有讨论数值稳定性的意义;
- 普适性:非线性方程\(y'=f(x,y)\)可在任意点邻域做局部线性化,最终化为\(u'=\lambda u\)的形式,其中\(\lambda = f_y'(\bar{x},\bar{y})\);
- 方程组适配:常微分方程组\(\boldsymbol{y}' = \boldsymbol{A}\boldsymbol{y}\)中,矩阵\(\boldsymbol{A}\)的特征值就是模型方程中的\(\lambda\),因此\(\lambda\)取复数可覆盖方程组场景。
二、绝对稳定性与绝对稳定域的核心定义
2.1 稳定函数与绝对稳定条件
对于模型方程\(y'=\lambda y\),任意单步法都可写成如下递推形式:
其中\(\mu = h\lambda\)称为复步长,\(E(\mu)\)称为该方法的稳定函数(增长因子)。
可以严格推导:数值解的扰动\(\varepsilon_n = y_n^* - y_n\)(\(y_n^*\)为带扰动的数值解)满足和数值解完全相同的递推关系:
因此,扰动是否增长完全由\(|E(\mu)|\)决定:
- \(|E(\mu)| < 1\):每一步扰动衰减,方法稳定;
- \(|E(\mu)| > 1\):每一步扰动放大,方法不稳定;
- \(|E(\mu)| = 1\):扰动幅值不变,临界稳定。
由此给出绝对稳定性的严格定义:
定义9.6 绝对稳定性与绝对稳定域
单步法求解模型方程\(y'=\lambda y\)时,递推式为\(y_{n+1}=E(\mu)y_n\)(\(\mu=h\lambda\))。若满足\(|E(\mu)| < 1\),则称该方法在\(\mu\)处绝对稳定。
在\(\mu\)的复平面上,所有满足\(|E(\mu)| < 1\)的点构成的区域,称为绝对稳定域;绝对稳定域与实轴的交集,称为绝对稳定区间。
核心解读:
- 绝对稳定域是方法的固有属性,仅和方法构造有关;
- 对给定的\(\lambda\),只要步长\(h\)使得\(\mu=h\lambda\)落在绝对稳定域内,方法就稳定;
- 绝对稳定区间针对工程中最常见的实\(\lambda<0\)场景,直接给出步长\(h\)的取值范围。
三、常用单步法的绝对稳定域完整推导
3.1 显式欧拉法(向前欧拉法)
步骤1:推导稳定函数
显式欧拉法格式:\(y_{n+1} = y_n + h f(x_n,y_n)\),代入模型方程\(f(x,y)=\lambda y\)得:
令\(\mu=h\lambda\),稳定函数为:
步骤2:推导绝对稳定域
绝对稳定条件\(|E(\mu)| < 1\),即:
复平面上的几何意义:以\((-1,0)\)为圆心、半径为1的单位圆内部。
步骤3:推导绝对稳定区间
\(\mu\)为实数时,解不等式\(|1+\mu|<1\):
即绝对稳定区间为\((-2, 0)\)。
工程应用
当\(\lambda<0\)时,代入得\(0 < h < -\frac{2}{\lambda}\)。对应例9.4,\(\lambda=-100\),因此\(h<0.02\)时方法稳定,和实例计算完全一致。
3.2 隐式欧拉法(向后欧拉法)
步骤1:推导稳定函数
隐式欧拉法格式:\(y_{n+1} = y_n + h f(x_{n+1},y_{n+1})\),代入模型方程得:
整理含\(y_{n+1}\)的项:
令\(\mu=h\lambda\),稳定函数为:
步骤2:推导绝对稳定域
绝对稳定条件\(|E(\mu)| < 1\),即:
复平面上的几何意义:以\((1,0)\)为圆心、半径为1的单位圆外部。
步骤3:推导绝对稳定区间
\(\mu\)为实数时,结合\(\text{Re}(\lambda)<0\)即\(\mu=h\lambda<0\),\(|1-\mu|>1\)恒成立,因此绝对稳定区间为\((-\infty, 0)\)。
工程应用
当\(\lambda<0\)时,无论步长\(h\)取多大正数,方法永远稳定,这是隐式方法的核心优势。
3.3 梯形法
步骤1:推导稳定函数
梯形法格式:\(y_{n+1} = y_n + \frac{h}{2}\left[ f(x_n,y_n) + f(x_{n+1},y_{n+1}) \right]\),代入模型方程得:
整理得:
令\(\mu=h\lambda\),稳定函数为:
步骤2:推导绝对稳定域
绝对稳定条件\(|E(\mu)| < 1\),两边取模的平方,对\(\mu=a+ib\)有:
化简得\(a < 0\),即\(\text{Re}(\mu) < 0\)。因此梯形法的绝对稳定域是整个左半复平面。
步骤3:推导绝对稳定区间
绝对稳定域与实轴的交集为\(\mu<0\),即绝对稳定区间为\((-\infty, 0)\)。
3.4 显式龙格-库塔(R-K)方法
显式R-K方法的稳定函数,本质是指数函数\(e^\mu\)的p阶泰勒多项式(p为方法的阶数),因为模型方程的精确解为\(y_{n+1}=e^\mu y_n\),p阶R-K的局部截断误差为\(O(h^{p+1})\),因此稳定函数是\(e^\mu\)的p阶泰勒展开。
1~4阶显式R-K方法的核心参数:
| 方法阶数 | 稳定函数\(E(\mu)\) | 绝对稳定区间 |
|---|---|---|
| 一阶(显式欧拉) | \(1+\mu\) | \((-2, 0)\) |
| 二阶(改进欧拉) | \(1+\mu+\frac{\mu^2}{2}\) | \((-2, 0)\) |
| 三阶 | \(1+\mu+\frac{\mu^2}{2!}+\frac{\mu^3}{3!}\) | \((-2.51, 0)\) |
| 四阶(经典R-K) | \(1+\mu+\frac{\mu^2}{2!}+\frac{\mu^3}{3!}+\frac{\mu^4}{4!}\) | \((-2.78, 0)\) |
核心结论
- 显式R-K方法的绝对稳定域都是有限区域,阶数越高,绝对稳定区间越大,对步长的限制越宽松;
- 所有显式R-K方法都是条件稳定,必须选择合适的步长才能保证稳定性。
用例9.5验证:
初值问题\(y'=-20y\),\(\lambda=-20\),四阶R-K求解:
- 步长h=0.1:\(\mu=-2\),落在稳定区间\((-2.78,0)\)内,方法稳定,误差快速衰减;
- 步长h=0.2:\(\mu=-4\),落在稳定区间外,方法不稳定,误差指数级爆炸增长,和计算结果完全一致。
四、A-稳定性(无条件稳定性)
4.1 定义与核心意义
对于刚性微分方程(\(\lambda\)的实部绝对值极大,衰减极快),显式方法的稳定区间极小,需要取极小的步长,计算量极大。因此引入A-稳定性描述无条件稳定的方法。
定义9.7 A-稳定性:若数值方法的绝对稳定域包含整个左半复平面\(\{\mu | \text{Re}(\mu) < 0\}\),则称该方法是A-稳定的。
4.2 关键结论
- A-稳定的方法,对所有\(\text{Re}(\lambda)<0\)的模型方程,无论步长h取多大,方法始终稳定,对步长无限制;
- 隐式欧拉法、梯形法都是A-稳定的;
- 所有显式单步法都不是A-稳定的,其绝对稳定域为有限区域,无法覆盖整个左半复平面;
- A-稳定的方法非常适合求解刚性微分方程,无需为了稳定性牺牲步长。
五、核心知识点总结表格
| 数值方法 | 稳定函数\(E(\mu)\)(\(\mu=h\lambda\)) | 绝对稳定域 | 绝对稳定区间 | 是否A-稳定 | 方法类型 |
|---|---|---|---|---|---|
| 显式欧拉法(一阶R-K) | \(1+\mu\) | 以\((-1,0)\)为圆心、半径1的单位圆内部 | \((-2, 0)\) | 否 | 显式 |
| 二阶显式R-K | \(1+\mu+\frac{\mu^2}{2}\) | 复平面有限有界区域 | \((-2, 0)\) | 否 | 显式 |
| 三阶显式R-K | \(1+\mu+\frac{\mu^2}{2!}+\frac{\mu^3}{3!}\) | 复平面有限有界区域 | \((-2.51, 0)\) | 否 | 显式 |
| 四阶显式R-K | \(1+\mu+\frac{\mu^2}{2!}+\frac{\mu^3}{3!}+\frac{\mu^4}{4!}\) | 复平面有限有界区域 | \((-2.78, 0)\) | 否 | 显式 |
| 隐式欧拉法 | \(\frac{1}{1-\mu}\) | 以\((1,0)\)为圆心、半径1的单位圆外部 | \((-\infty, 0)\) | 是 | 隐式 |
| 梯形法 | \(\frac{1+\frac{\mu}{2}}{1-\frac{\mu}{2}}\) | 整个左半复平面\(\text{Re}(\mu)<0\) | \((-\infty, 0)\) | 是 | 隐式 |
六、补充说明
- 收敛性与稳定性的关系:收敛性是“步长h→0的渐近性质”,稳定性是“固定步长h的误差传播性质”。实际计算中h不能无限缩小,因此稳定性是数值方法可用的前提,不稳定的方法即使收敛,也无法得到正确结果;
- 显式与隐式的取舍:显式方法计算简单、无需迭代,但有步长限制;隐式方法需要迭代求解,单步计算量大,但稳定性好,适合刚性方程;
- 稳定区间的工程应用:对给定方程\(y'=f(x,y)\),先计算\(f_y'\)的取值得到\(\lambda\)的范围,再根据方法的绝对稳定区间选择步长h,保证\(\mu=h\lambda\)落在稳定区间内。
posted on 2026-03-07 23:09 Indian_Mysore 阅读(0) 评论(0) 收藏 举报
浙公网安备 33010602011771号