昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

9.6线性多步法的相容性与收敛性

线性多步法的相容性与收敛性 详细讲解与推导证明

作为常微分方程数值解法的核心内容,线性k步法的相容性、收敛性是判断数值方法是否有效的核心准则,以下将从基础定义出发,完成严格推导证明,最终归纳核心知识点。


一、前置基础:线性k步法与初值问题

我们研究的核心对象是一阶常微分方程初值问题(IVP)

\[\begin{cases} y'(x) = f(x,y(x)), & x\in [a,b] \\ y(a) = y_0 \end{cases} \tag{9.1/9.2} \]

用于求解该问题的线性k步法的通用格式为:

\[y_{n+k} = \sum_{i=0}^{k-1} \alpha_i y_{n+i} + h \sum_{i=0}^k \beta_i f_{n+i}, \quad n=0,1,2,\dots \tag{9.34} \]

符号说明:

  • \(h\)为等距步长,离散节点\(x_n = x_0 + nh\)\(x_0=a\)
  • \(f_{n+i} = f(x_{n+i}, y_{n+i})\),即精确解的导数\(y'(x_{n+i})\)
  • \(\alpha_i, \beta_i\)为与\(n,h\)无关的常数,因此称为线性多步法;格式需要\(k\)个初始值才能启动递推,因此称为k步法。

二、核心概念1:相容性(Consistency)

相容性的本质是:当步长\(h\to0\)时,离散的差分格式能够还原为原连续的微分方程,是数值方法对原方程的“局部逼近能力”的刻画。

2.1 局部截断误差(LTE):相容性的核心载体

要定义相容性,首先需要明确局部截断误差(Local Truncation Error),这是衡量单步逼近精度的核心指标。

严格定义

\(y(x)\)是初值问题的精确解,线性k步法的局部截断误差为:

\[T_{n+k} = y(x_{n+k}) - \sum_{i=0}^{k-1} \alpha_i y(x_{n+i}) - h \sum_{i=0}^k \beta_i y'(x_{n+i}) \tag{9.35} \]

定义解读

“局部”的含义:假设前\(k\)个节点的数值解\(y_{n},y_{n+1},\dots,y_{n+k-1}\)均等于精确解\(y(x_{n}),y(x_{n+1}),\dots,y(x_{n+k-1})\),此时用多步法计算\(y_{n+k}\),与精确解\(y(x_{n+k})\)的差值,就是仅由单步差分格式产生的误差,不包含前序步骤的误差积累。

2.2 相容性的定义

定义:若局部截断误差满足\(T_{n+k} = O(h^{p+1})\),且\(p\geq1\),则称k步法与微分方程(9.1)相容。
其等价条件为:

\[\lim_{h\to0} \frac{1}{h}T_{n+k} = 0 \]

定义解读

  • \(p\geq1\),则\(T_{n+k}=O(h^2)\),此时\(\frac{1}{h}T_{n+k}=O(h)\),当\(h\to0\)时极限为0,差分格式的误差趋于0,能够逼近原微分方程;
  • 相容性等价于数值方法的阶数至少为1阶,这是数值方法有效的最低要求。

2.3 两个特征多项式:相容性的代数工具

为了将差分格式的系数转化为可分析的代数性质,引入两个核心多项式:

  1. 第一特征多项式(齐次特征多项式)

\[\rho(\xi) = \xi^k - \sum_{i=0}^{k-1} \alpha_i \xi^i \]

  1. 第二特征多项式(增量多项式)

\[\sigma(\xi) = \sum_{i=0}^k \beta_i \xi^i \]

多项式的意义

线性k步法的所有核心性质(相容性、收敛性、稳定性),完全由这两个多项式决定,实现了“差分格式→代数多项式”的转化,可用代数方法分析数值方法的性质。

2.4 定理9.5 相容性充要条件 详细证明

定理9.5:线性k步法(9.34)与微分方程(9.1)相容的充分必要条件是

\[\rho(1)=0, \quad \rho'(1)=\sigma(1) \]

证明过程

我们通过对局部截断误差做泰勒展开,推导相容性的核心条件。

步骤1:精确解的泰勒展开

\(y(x_{n+i})=y(x_n+ih)\)\(y'(x_{n+i})=y'(x_n+ih)\)\(x=x_n\)处做无穷阶泰勒展开:

\[y(x_n + ih) = \sum_{m=0}^\infty \frac{(ih)^m}{m!} y^{(m)}(x_n) \]

\[y'(x_n + ih) = \sum_{m=1}^\infty \frac{(ih)^{m-1}}{(m-1)!} y^{(m)}(x_n) \]

步骤2:代入局部截断误差的定义

将泰勒展开代入\(T_{n+k}\)的定义式,交换求和顺序:

\[\begin{align*} T_{n+k} &= \sum_{m=0}^\infty \frac{h^m}{m!} \left[ k^m - \sum_{i=0}^{k-1} \alpha_i i^m \right] y^{(m)}(x_n) - h \sum_{m=1}^\infty \frac{h^{m-1}}{(m-1)!} \left[ \sum_{i=0}^k \beta_i i^{m-1} \right] y^{(m)}(x_n) \\ &= \sum_{m=0}^\infty c_m h^m y^{(m)}(x_n) \end{align*} \]

其中系数\(c_m\)的表达式为:

\[\begin{cases} c_0 = 1 - \sum_{i=0}^{k-1} \alpha_i \\ c_m = \frac{1}{m!} \left( k^m - \sum_{i=0}^{k-1} \alpha_i i^m - m \sum_{i=0}^k \beta_i i^{m-1} \right), & m\geq1 \end{cases} \]

步骤3:相容性条件的推导

相容性要求\(\lim_{h\to0}\frac{1}{h}T_{n+k}=0\),将\(T_{n+k}\)除以\(h\)得:

\[\frac{1}{h}T_{n+k} = \frac{c_0}{h} y(x_n) + c_1 y'(x_n) + c_2 h y''(x_n) + \dots \]

  • 若要\(h\to0\)时极限存在且为0,必须消除\(\frac{c_0}{h}\)的奇性,因此必须有\(c_0=0\)
  • \(c_0=0\)后,极限为\(c_1 y'(x_n)\),要对任意初值问题(任意\(y'(x_n)\))都成立,必须\(c_1=0\)
步骤4:与特征多项式的对应
  • 计算\(\rho(1)\)\(\rho(1) = 1^k - \sum_{i=0}^{k-1}\alpha_i \cdot 1^i = 1 - \sum_{i=0}^{k-1}\alpha_i = c_0\),因此\(c_0=0 \iff \rho(1)=0\)
  • 计算\(\rho'(1)\)\(\rho'(\xi)=k\xi^{k-1} - \sum_{i=0}^{k-1}\alpha_i \cdot i \xi^{i-1}\),因此\(\rho'(1)=k - \sum_{i=0}^{k-1}\alpha_i i\)
  • 计算\(\sigma(1)\)\(\sigma(1)=\sum_{i=0}^k \beta_i \cdot 1^i = \sum_{i=0}^k \beta_i\)
  • 因此\(c_1 = k - \sum_{i=0}^{k-1}\alpha_i i - \sum_{i=0}^k \beta_i = \rho'(1) - \sigma(1)\),即\(c_1=0 \iff \rho'(1)=\sigma(1)\)
必要性与充分性闭环
  • 必要性:若方法相容,则\(c_0=0,c_1=0\),故\(\rho(1)=0,\rho'(1)=\sigma(1)\)
  • 充分性:若\(\rho(1)=0,\rho'(1)=\sigma(1)\),则\(c_0=0,c_1=0\),此时\(T_{n+k}=O(h^2)\)\(\frac{1}{h}T_{n+k}=O(h)\),满足\(\lim_{h\to0}\frac{1}{h}T_{n+k}=0\),方法相容。

三、核心概念2:收敛性(Convergence)

收敛性的本质是:当步长\(h\to0\)时,数值解在整个求解区间上全局逼近精确解,是衡量数值方法“全局有效性”的最终准则。

3.1 收敛性的前置背景

线性k步法需要\(k\)个初始值才能启动递推,但原微分方程仅给出1个初值\(y(x_0)=y_0\),因此完整的多步法格式为:

\[\begin{cases} y_{n+k} = \sum_{i=0}^{k-1} \alpha_i y_{n+i} + h \sum_{i=0}^k \beta_i f_{n+i}, & n=0,1,2,\dots \\ y_j = \eta_j(h), & j=0,1,\dots,k-1 \end{cases} \tag{9.46} \]

其中\(y_0=\eta_0(h)=y_0\)由原方程给出,剩余\(k-1\)个初值\(\eta_1(h),\dots,\eta_{k-1}(h)\)由单步法(如欧拉法、龙格-库塔法)计算,且要求初值满足\(\lim_{h\to0}\eta_j(h)=y(x_j)\)(初值收敛到精确值)。

3.2 收敛性的严格定义(定义9.9)

设初值问题(9.1)(9.2)有精确解\(y(x)\),对固定的节点\(x=x_n = x_0 + nh \in [a,b]\)\(x_n\)固定,\(h\to0\)\(n\to\infty\),保证\(nh=x_n-x_0\)为定值),若数值解满足:

\[\lim_{\substack{h\to0 \\ x_n=x}} y_n = y(x) \]

则称线性k步法(9.46)是收敛的。

定义解读

  • 收敛性是全局性质:考虑从\(x_0\)\(x_n\)所有步骤的误差积累,而非单步的局部误差;
  • 固定\(x_n\)的意义:我们关注的是“求解区间上某一固定点的数值解,是否随步长缩小趋于精确解”,而非固定n让h→0。

3.3 定理9.6 收敛性与相容性的关系 详细证明

定理9.6:设线性多步法(9.46)是收敛的,则它一定是相容的。
即:收敛性必然蕴含相容性,相容性是收敛性的必要条件

证明过程

我们通过构造两个典型的测试初值问题,利用收敛性的定义,推导得到相容性的充要条件。

步骤1:证明\(\rho(1)=0\)(即\(c_0=0\)

构造测试初值问题:

\[\begin{cases} y'(x) = 0, & x\in [a,b] \\ y(a) = 0 \end{cases} \]

该问题的精确解为\(y(x)\equiv0\)

对于该问题,\(f(x,y)=0\),多步法的递推式简化为线性齐次递推关系:

\[y_{n+k} = \sum_{i=0}^{k-1} \alpha_i y_{n+i} \]

由于方法收敛,对固定的\(x=x_n\),当\(h\to0\)时,\(y_n \to y(x)=0\)

取初值\(\eta_j(h) = h\)(满足\(\lim_{h\to0}\eta_j(h)=0=y(x_j)\),符合收敛性的初值要求),则递推解为\(y_n = h \cdot C_n\),其中\(C_n\)为与h无关的常数。

对固定的\(x=x_0+nh=T\)(定值),\(n=T/h\),收敛性要求:

\[\lim_{h\to0} y_n = \lim_{h\to0} h \cdot C_{T/h} = 0 \]

再构造第二个测试问题:

\[\begin{cases} y'(x) = 1, & x\in [a,b] \\ y(a) = 0 \end{cases} \]

精确解为\(y(x)=x-x_0\),代入局部截断误差的定义得:

\[T_{n+k} = (n+k)h - \sum_{i=0}^{k-1}\alpha_i (n+i)h - h\sum_{i=0}^k \beta_i = h\left( n c_0 + c_1 \right) \]

其中\(c_0=1-\sum_{i=0}^{k-1}\alpha_i\)\(c_1=k-\sum_{i=0}^{k-1}\alpha_i i - \sum_{i=0}^k \beta_i\)

定义全局误差\(e_n = y(x_n) - y_n\),则误差满足递推关系:

\[e_{n+k} = \sum_{i=0}^{k-1}\alpha_i e_{n+i} + T_{n+k} \]

由于方法收敛,对固定的\(x=x_n=T\)\(\lim_{h\to0}e_n=0\)。将\(T_{n+k}\)代入得:

\[e_{n+k} - \sum_{i=0}^{k-1}\alpha_i e_{n+i} = h(n c_0 + c_1) \]

固定\(T=x_0+nh\),则\(n=(T-x_0)/h\),代入右边得:

\[h\left( \frac{T-x_0}{h} c_0 + c_1 \right) = (T-x_0)c_0 + h c_1 \]

\(h\to0\)时,左边极限为\(0 - \sum_{i=0}^{k-1}\alpha_i \cdot 0 = 0\),右边极限为\((T-x_0)c_0\)。因此:

\[(T-x_0)c_0 = 0 \]

该式对任意\(T\in[a,b]\)成立,故\(c_0=0\),即\(\rho(1)=0\)

步骤2:证明\(\rho'(1)=\sigma(1)\)(即\(c_1=0\)

已证\(c_0=0\),即\(\sum_{i=0}^{k-1}\alpha_i=1\),此时误差递推式简化为:

\[e_{n+k} - \sum_{i=0}^{k-1}\alpha_i e_{n+i} = h c_1 \]

由于方法收敛,初值满足\(\eta_j(h)=y(x_j)+o(h)=jh+o(h)\),即初值误差\(e_j=o(h)\),因此全局误差\(e_n=o(h)\),即\(y_n = nh + o(h)\)

\(y_n = nh + o(h)\)代入原多步法递推式:

\[(n+k)h + o(h) = \sum_{i=0}^{k-1}\alpha_i \left[ (n+i)h + o(h) \right] + h\sum_{i=0}^k \beta_i \]

展开右边并利用\(\sum_{i=0}^{k-1}\alpha_i=1\)消去\(nh\)项,两边除以\(h\)得:

\[k + o(1) = \sum_{i=0}^{k-1}\alpha_i i + \sum_{i=0}^k \beta_i + o(1) \]

\(h\to0\)时,\(o(1)\to0\),因此:

\[k - \sum_{i=0}^{k-1}\alpha_i i - \sum_{i=0}^k \beta_i = 0 \]

\(c_1=0\),等价于\(\rho'(1)=\sigma(1)\)

结论

收敛性必然推出\(\rho(1)=0\)\(\rho'(1)=\sigma(1)\),即收敛的方法一定是相容的。

补充说明

相容性只是收敛的必要非充分条件,相容的方法不一定收敛。线性多步法收敛的充要条件是著名的Dahlquist等价定理:线性多步法收敛,当且仅当方法相容且满足根条件(0-稳定)(根条件:\(\rho(\xi)\)的所有根的模≤1,且模为1的根均为单根)。


四、核心知识点归纳总结表

核心概念 严格数学定义 核心判定条件 等价表述 直观含义 关键性质
线性k步法 \(y_{n+k} = \sum_{i=0}^{k-1}\alpha_i y_{n+i} + h\sum_{i=0}^k \beta_i f_{n+i}\)\(\alpha_i,\beta_i\)为与n,h无关的常数 由系数\(\alpha_0,\dots,\alpha_{k-1},\beta_0,\dots,\beta_k\)唯一确定 由第一、第二特征多项式唯一确定 用k个历史节点的数值解,递推下一个节点的解,是单步法的推广 误差满足线性递推关系,可通过代数方法分析性质
第一特征多项式\(\rho(\xi)\) \(\rho(\xi) = \xi^k - \sum_{i=0}^{k-1}\alpha_i \xi^i\) \(\alpha_i\)唯一确定 齐次递推部分的特征方程为\(\rho(\xi)=0\) 刻画多步法的齐次递推性质 根的分布决定方法的0-稳定性,是收敛性的核心
第二特征多项式\(\sigma(\xi)\) \(\sigma(\xi) = \sum_{i=0}^k \beta_i \xi^i\) \(\beta_i\)唯一确定 导数项的加权系数多项式 刻画多步法对导数项的加权方式 \(\rho(\xi)\)共同决定方法的阶数、相容性
局部截断误差\(T_{n+k}\) \(T_{n+k}=y(x_{n+k}) - \sum_{i=0}^{k-1}\alpha_i y(x_{n+i}) - h\sum_{i=0}^k \beta_i y'(x_{n+i})\) 泰勒展开\(T_{n+k}=\sum_{m=0}^\infty c_m h^m y^{(m)}(x_n)\) 前k步为精确值时,单步计算的误差 衡量差分格式对微分方程的单步逼近精度 \(T_{n+k}=O(h^{p+1})\)时,方法为p阶
相容性 \(T_{n+k}=O(h^{p+1})\)\(p\geq1\),称方法相容,等价于\(\lim_{h\to0}\frac{1}{h}T_{n+k}=0\) 充要条件:\(\rho(1)=0\)\(\rho'(1)=\sigma(1)\) 方法的阶数\(p\geq1\) 步长趋于0时,差分格式还原为原微分方程 是收敛的必要条件,相容≠收敛
收敛性 对固定\(x=x_n=x_0+nh\),若\(\lim_{\substack{h\to0 \\ x_n=x}} y_n = y(x)\),称方法收敛 必要条件:相容;充要条件:相容+根条件(0-稳定) 全局误差\(e_n=y(x_n)-y_n\)\(h\to0\)趋于0 步长趋于0时,数值解全局逼近精确解 收敛的方法一定相容,是数值方法有效的最终准则
定理9.6 收敛的线性k步法一定是相容的 收敛\(\implies \rho(1)=0\)\(\rho'(1)=\sigma(1)\) 收敛\(\implies\)方法至少1阶 全局收敛的方法,必须先满足对原方程的局部逼近性 相容性是收敛的必要非充分条件

例9.9 完整推导与核心知识点详解

本案例是常微分方程数值解法中,线性多步法“相容但不收敛”的经典反例,核心是验证“相容性是收敛的必要非充分条件”,并引出收敛的充要条件(零点条件+相容性),以下是完整推导与知识点解读。


一、例9.9 完整分步推导

1. 基础信息对应

我们研究的线性二步法格式为:

\[\begin{cases} y_{n+2}=3y_{n+1}-2y_n + h(f_{n+1}-2f_n), \quad n=0,1,2,\dots \\ y_0=\eta_0(h),\ y_1=\eta_1(h) \end{cases} \tag{9.47} \]

求解的初值问题为:

\[\begin{cases} y'=2x \\ y(0)=0 \end{cases} \]

该初值问题的精确解\(y(x)=x^2\)(对 \(y'=2x\) 积分,代入初值 \(y(0)=0\) 得积分常数 \(C=0\))。


2. 第一步:验证方法的相容性

根据线性多步法相容性的充要条件(定理9.5),方法相容当且仅当:

\[\rho(1)=0,\quad \rho'(1)=\sigma(1) \]

其中 \(\rho(\xi)\) 为第一特征多项式,\(\sigma(\xi)\) 为第二特征多项式。

步骤1:写出两个特征多项式

线性k步法的特征多项式通用形式为:

\[\rho(\xi)=\xi^k - \sum_{i=0}^{k-1}\alpha_i \xi^i,\quad \sigma(\xi)=\sum_{i=0}^k \beta_i \xi^i \]

本例为二步法(\(k=2\)),对比格式(9.47),系数为:\(\alpha_0=-2,\ \alpha_1=3\)\(\beta_0=-2,\ \beta_1=1,\ \beta_2=0\)

代入得:

\[\rho(\xi)=\xi^2 - 3\xi + 2,\quad \sigma(\xi)=\xi - 2 \]

步骤2:验证相容性条件

  1. 计算 \(\rho(1)\)\(\rho(1)=1^2-3\times1+2=0\),满足第一个条件;
  2. 计算导数 \(\rho'(\xi)=2\xi-3\),得 \(\rho'(1)=2\times1-3=-1\)
  3. 计算 \(\sigma(1)=1-2=-1\),满足 \(\rho'(1)=\sigma(1)\)

因此,该线性二步法满足相容性条件


3. 第二步:代入初值与右端项,得到完整差分方程

本例取初值 \(y_0=0,\ y_1=h\),满足收敛性定义的初值要求:\(\lim_{h\to0}\eta_j(h)=y(x_j)\)\(h\to0\)\(y_1=h\to0=y(0)\))。

将右端项 \(f(x,y)=2x\) 代入格式,其中 \(x_n=nh\),因此:

\[f_n=2x_n=2nh,\quad f_{n+1}=2x_{n+1}=2(n+1)h \]

代入原格式的增量项:

\[h(f_{n+1}-2f_n)=h\left[2(n+1)h - 2\times2nh\right]=-2nh^2+2h^2 \]

最终得到完整的线性非齐次差分方程:

\[y_{n+2}-3y_{n+1}+2y_n=-2nh^2+2h^2,\quad y_0=0,\ y_1=h \tag{9.48} \]


4. 第三步:求解差分方程

线性差分方程的通解 = 齐次方程的通解 + 非齐次方程的一个特解。

步骤1:求齐次通解

齐次方程为 \(y_{n+2}-3y_{n+1}+2y_n=0\),特征方程为 \(\rho(\xi)=\xi^2-3\xi+2=0\),解得特征根:

\[\xi_1=1,\quad \xi_2=2 \]

因此齐次通解为:

\[y_n^h = A\cdot1^n + B\cdot2^n = A + B\cdot2^n \]

其中 \(A,B\) 为待定常数。

步骤2:求非齐次特解

非齐次项为一次多项式 \(-2h^2\cdot n + 2h^2\),且 \(\xi=1\) 是特征方程的单根,因此设特解形式为:

\[y_n^* = n\cdot(Cn+D) = Cn^2 + Dn \]

将特解代入差分方程,展开并匹配系数:

  • 左边化简得:\(-2C\cdot n + (C-D)\)
  • 右边为:\(-2h^2\cdot n + 2h^2\)

对应系数相等,解得:\(C=h^2,\ D=-h^2\),因此特解为:

\[y_n^* = h^2 n(n-1) \]

步骤3:通解+初值确定常数

差分方程的通解为:

\[y_n = A + B\cdot2^n + h^2 n(n-1) \]

代入初值 \(y_0=0,\ y_1=h\)

  1. \(n=0\)\(0=A+B\)
  2. \(n=1\)\(h=A+2B\)

解得:\(A=-h,\ B=h\),因此差分方程的最终解为:

\[y_n = h(2^n -1) + n(n-1)h^2,\quad x=nh \]


5. 第四步:验证收敛性

收敛性的定义为:固定求解点 \(x=x_n=nh\)\(x\) 为定值,\(h\to0\)\(n\to\infty\)),若 \(\lim_{h\to0}y_n=y(x)\),则方法收敛

\(n=x/h\) 代入解的表达式,化简:

\[\begin{align*} y_n &= h\left(2^{x/h}-1\right) + \frac{x}{h}\left(\frac{x}{h}-1\right)h^2 \\ &= h\cdot2^{x/h} - h + x(x-h) \end{align*} \]

\(h\to0^+\) 时,令 \(t=1/h\to+\infty\),则 \(h\cdot2^{x/h}=\frac{2^{xt}}{t}\),指数函数的增长速度远快于多项式,因此 \(\frac{2^{xt}}{t}\to+\infty\)

最终极限为:

\[\lim_{h\to0}y_n = \lim_{h\to0}\left(h\cdot2^{x/h} - h + x^2 -xh\right)=+\infty \]

而精确解 \(y(x)=x^2\) 为有限值,因此数值解不收敛到精确解,该方法不收敛


二、核心概念与定理解读

1. 定义9.10 零点条件(根条件/零稳定条件)

严格定义

如果线性多步法的第一特征多项式 \(\rho(\xi)\) 的所有零点(特征根)都在单位圆内或单位圆上,且单位圆上的零点均为单零点,则称该线性多步法满足零点条件。

直观解读

  • 单位圆:复平面上满足 \(|\xi|\leq1\) 的区域,单位圆上即 \(|\xi|=1\)
  • 零点条件的本质:保证差分方程的解不会随步数 \(n\) 指数发散,即方法是零稳定的(初值的微小扰动不会被无限放大)。

本例中 \(\rho(\xi)\) 的根为 \(\xi_1=1\)\(\xi_2=2\),其中 \(\xi_2=2\) 的模为 \(2>1\),超出单位圆范围,因此不满足零点条件,这是方法相容但不收敛的核心原因。


2. 定理9.7 线性多步法收敛的充要条件(Dahlquist等价定理核心)

定理内容

若线性多步法是相容的,则该方法收敛的充分必要条件是:线性多步法满足零点条件。

核心意义

  1. 补充了收敛性的完整条件:收敛 ⇔ 相容 + 零点条件
  2. 解释了本例的矛盾:方法仅满足相容性,不满足零点条件,因此不收敛;
  3. 明确了数值方法有效的两大核心:
    • 相容性:保证差分格式局部逼近原微分方程(单步误差是高阶小量);
    • 零点条件:保证全局误差不会随步数无限放大(稳定性)。

三、核心知识点总结表

核心内容 关键结论 本例对应情况
线性二步法格式 \(y_{n+2}=3y_{n+1}-2y_n + h(f_{n+1}-2f_n)\) 系数 \(\alpha_0=-2,\alpha_1=3\)\(\beta_0=-2,\beta_1=1\)
特征多项式 \(\rho(\xi)=\xi^2-3\xi+2\)\(\sigma(\xi)=\xi-2\) 特征根 \(\xi_1=1,\xi_2=2\)
相容性 充要条件 \(\rho(1)=0,\rho'(1)=\sigma(1)\) 满足,\(\rho(1)=0,\rho'(1)=\sigma(1)=-1\)
零点条件 所有特征根满足 $ \xi
收敛性 充要条件:相容 + 零点条件 不收敛,仅满足相容性,不满足零点条件
核心启示 相容性是收敛的必要非充分条件,零稳定(零点条件)是收敛的另一核心要求 特征根超出单位圆导致解指数发散,数值解不收敛

线性多步法的稳定性与绝对稳定性 详细讲解与推导

本节是常微分方程数值解法的核心内容,解决的核心问题是:数值计算中的扰动(舍入误差、初值误差等)是否会被无限放大,导致数值解完全失真。我们将从零稳定性(简称稳定性)绝对稳定性两个层级,完成定义解读、定理推导与核心特性分析,并关联之前的相容性、收敛性知识点,形成完整的理论体系。


一、零稳定性(稳定性):h→0时的理论稳定性

1. 研究背景与扰动模型

数值计算中,我们无法得到完全精确的初始值,计算过程中也会存在舍入误差、右端项的计算误差,这些统称为扰动。稳定性的核心,就是研究这些扰动对数值解的影响是否可控。

我们的研究对象是线性k步法的完整格式:

\[\begin{cases} y_{n+k} = \sum_{i=0}^{k-1} \alpha_i y_{n+i} + h \sum_{i=0}^k \beta_i f(x_{n+i}, y_{n+i}), \quad n=0,1,\dots,N-1 \\ y_j = \eta_j(h), \quad j=0,1,\dots,k-1 \end{cases} \tag{9.46} \]

其中总步数 \(N=\frac{b-a}{h}\)\([a,b]\) 是求解区间。

设扰动序列为 \(\{\delta_n\}_{n=0}^N\),扰动后的数值解为 \(\{z_n\}_{n=0}^N\),则扰动后的方程为:

\[\begin{cases} z_{n+k} = \sum_{i=0}^{k-1} \alpha_i z_{n+i} + h\left( \sum_{i=0}^k \beta_i f(x_{n+i}, z_{n+i}) + \delta_{n+k} \right) \\ z_j = \eta_j(h) + \delta_j, \quad j=0,1,\dots,k-1 \end{cases} \tag{9.49} \]

符号说明:

  • \(\delta_j\)\(j=0,\dots,k-1\)):初始值的扰动;
  • \(\delta_{n+k}\)\(n\geq0\)):差分方程右端项的计算扰动(如舍入误差)。

2. 零稳定性的严格定义(定义9.11)

定义原文解读

对初值问题,若存在常数 \(C\) 和临界步长 \(h_0\),使得对所有 \(h\in(0,h_0)\),当所有扰动满足 \(|\delta_n|\leq\varepsilon\)\(0\leq n\leq N\))时,扰动带来的解误差满足:

\[|z_n - y_n| \leq C\varepsilon \]

则称该线性多步法是稳定的,也称为零稳定的

核心含义

  1. 误差可控性:初始和计算过程的小扰动,只会带来数值解的有界误差,不会被无限放大;
  2. “零稳定”的由来:该稳定性是针对 \(h\to0\) 的场景定义的,对应收敛性分析中“步长趋于0,固定求解点”的极限过程,是数值方法收敛的前提;
  3. 常数 \(C\)\(h,n\) 无关,仅由方法本身决定,保证了对所有步数和步长的一致性。

3. 零稳定性的充要条件(定理9.8)

定理内容

线性多步法是稳定(零稳定)的充分必要条件是:该方法满足零点条件(根条件)

定理推导与解读

  1. 零点条件回顾:线性多步法的第一特征多项式 \(\rho(\xi)=\xi^k - \sum_{i=0}^{k-1}\alpha_i \xi^i\) 的所有零点(特征根),都满足 \(|\xi|\leq1\);且模等于1的零点,必须是单零点(无重根)。
  2. 推导逻辑
    \(h\to0\) 时,差分方程的解的特性完全由齐次部分决定,也就是由 \(\rho(\xi)=0\) 的根决定:
    • 若根满足 \(|\xi|<1\):对应的解分量会随 \(n\) 增大指数衰减,扰动不会放大;
    • 若根满足 \(|\xi|=1\) 且为单根:对应的解分量是有界的(常数或振荡有界),扰动不会放大;
    • 若根满足 \(|\xi|>1\):对应的解分量会随 \(n\) 增大指数发散,扰动被无限放大,方法不稳定;
    • 若单位圆上的根是重根:对应的解分量会随 \(n\) 多项式增长,扰动被放大,方法不稳定。
  3. 与收敛性的关联(Dahlquist等价定理)
    结合之前的收敛性定理,我们可以得到数值方法收敛的完整充要条件:

    \[\text{线性多步法收敛} \iff \text{方法相容} + \text{方法零稳定(满足零点条件)} \]

    这就是常微分方程数值解法中最核心的等价定理,完美串联了相容性、稳定性、收敛性三大核心概念。
    例如之前的例9.9,方法满足相容性,但不满足零点条件(根为2,模>1),因此是不稳定的,也不收敛,完全符合该定理。

二、绝对稳定性:有限步长下的实际计算稳定性

1. 研究背景

零稳定性是 \(h\to0\) 时的理论稳定性,但在实际工程计算中,步长 \(h\) 不可能无限缩小(否则计算量会爆炸),我们需要研究有限步长下,数值方法的稳定性与步长 \(h\)、方程特性的关系,这就是绝对稳定性的研究目标。

2. 测试模型方程与稳定性多项式推导

标准测试模型方程

数值稳定性分析的通用测试方程为线性常系数模型方程:

\[y' = \lambda y \tag{9.32} \]

其中 \(\lambda\) 为复数(可以是实数、纯虚数,对应不同的方程特性)。选择该方程的原因是:任何非线性微分方程,在局部都可以通过线性化转化为该形式,因此该方程的稳定性表现可以推广到一般方程。

稳定性多项式的推导

将线性k步法应用到模型方程 \(y'=\lambda y\),此时 \(f(x_{n+i},y_{n+i})=\lambda y_{n+i}\),代入多步法格式:

\[y_{n+k} = \sum_{i=0}^{k-1} \alpha_i y_{n+i} + h \sum_{i=0}^k \beta_i \cdot \lambda y_{n+i} \]

整理得:

\[y_{n+k} - \sum_{i=0}^{k-1} \alpha_i y_{n+i} - h\lambda \sum_{i=0}^k \beta_i y_{n+i} = 0 \tag{9.50} \]

引入第一、第二特征多项式:

\[\rho(\xi)=\xi^k - \sum_{i=0}^{k-1}\alpha_i \xi^i, \quad \sigma(\xi)=\sum_{i=0}^k \beta_i \xi^i \]

令无量纲参数 \(\mu = h\lambda\)(称为复步长参数),则差分方程可改写为特征多项式形式:

\[\rho(\xi) - \mu \sigma(\xi) = 0 \]

我们定义稳定性多项式

\[\pi(\xi,\mu) = \rho(\xi) - \mu \sigma(\xi) \tag{9.51} \]

这是关于 \(\xi\) 的k次多项式,其零点 \(\xi_r(\mu)\)\(r=1,2,\dots,k\))完全决定了差分方程解的特性。

绝对稳定的核心逻辑

差分方程的解由稳定性多项式的零点决定:若所有零点都满足 \(|\xi_r(\mu)| < 1\),则差分方程的解 \(y_n\) 会随着 \(n\to\infty\) 指数衰减到0,也就是说,任何初始扰动都会随着计算步数增加而衰减,不会被放大,这就是绝对稳定的本质。

3. 绝对稳定性的严格定义(定义9.12)

  1. 绝对稳定:对于给定的 \(\mu=h\lambda\),若稳定性多项式 \(\pi(\xi,\mu)\) 的所有零点 \(\xi_r\) 都满足 \(|\xi_r| < 1\),则称该线性多步法关于此 \(\mu\)绝对稳定的
  2. 绝对稳定域:在 \(\mu=h\lambda\) 的复平面上,所有使得方法绝对稳定的 \(\mu\) 的集合,称为该方法的绝对稳定域,记为 \(R\)
  3. 绝对稳定区间:绝对稳定域 \(R\) 与复平面实轴的交集,称为该方法的绝对稳定区间

定义解读

  • 绝对稳定域越大,方法对步长的适应性越强,实际计算中可以选择的步长范围越广;
  • 对于实系数的微分方程(\(\lambda\) 为实数),我们只需要关注绝对稳定区间,即可判断步长的选择范围。

4. 阿当姆斯方法的绝对稳定域与区间

阿当姆斯(Adams)方法是工程中最常用的线性多步法,分为显式阿当姆斯(Adams-Bashforth)隐式阿当姆斯(Adams-Moulton)两类,其绝对稳定特性如下:

绝对稳定域图形(图9-6)

  • 图(a) 显式阿当姆斯方法:绝对稳定域是复平面左半平面的有限区域,随着方法的阶数 \(k\) 增加,绝对稳定域逐渐缩小;
  • 图(b) 隐式阿当姆斯方法:绝对稳定域远大于同阶的显式方法,同样随阶数增加略有缩小,但始终比显式方法更宽松。

绝对稳定区间(表9-9)

整理后的规范表格如下:

显式阿当姆斯方法 绝对稳定区间 隐式阿当姆斯方法 绝对稳定区间
k=1阶(p=1,欧拉显式法) \(-2 < h\lambda < 0\) k=1阶(p=2,梯形法) \(-\infty < h\lambda < 0\)
k=2阶(p=2) \(-1 < h\lambda < 0\) k=2阶(p=3) \(-6.0 < h\lambda < 0\)
k=3阶(p=3) \(-0.55 < h\lambda < 0\) k=3阶(p=4) \(-3.0 < h\lambda < 0\)
k=4阶(p=4) \(-0.30 < h\lambda < 0\) k=4阶(p=5) \(-1.8 < h\lambda < 0\)

核心特性分析

  1. 显式vs隐式:同阶下,隐式阿当姆斯方法的绝对稳定区间远大于显式方法,这是隐式方法最核心的优势;
  2. 阶数影响:无论是显式还是隐式,随着阶数升高,绝对稳定区间都会缩小,对步长的限制更严格;
  3. 区间位置:所有绝对稳定区间都位于负实轴上,对应模型方程 \(y'=\lambda y\)\(\lambda<0\) 的情况(精确解指数衰减),数值方法需要模拟精确解的衰减特性,因此仅当 \(h\lambda<0\) 时可实现绝对稳定;
  4. A-稳定:k=1阶隐式阿当姆斯方法(梯形法)的绝对稳定域覆盖整个左半复平面,这类方法称为A-稳定,对步长无上限限制,是稳定性最优的方法。

三、核心概念对比与总结

1. 零稳定性 vs 绝对稳定性 核心区别

对比维度 零稳定性(稳定性) 绝对稳定性
研究场景 \(h\to0\) 时的理论稳定性 有限步长 \(h\) 下的实际计算稳定性
核心判定 第一特征多项式 \(\rho(\xi)\) 的零点条件 稳定性多项式 \(\pi(\xi,\mu)=\rho(\xi)-\mu\sigma(\xi)\) 的所有零点模<1
与步长的关系 与步长 \(h\) 无关,仅由方法系数决定 与步长 \(h\)、方程特性 \(\lambda\) 共同决定,核心参数 \(\mu=h\lambda\)
核心作用 保证方法的收敛性,是方法有效的理论前提 指导实际计算中步长的选择,保证数值计算的可靠性
误差特性 保证扰动有界,不会无限放大 要求扰动随步数增加指数衰减,稳定性要求更严格

2. 线性多步法核心性质的逻辑关系

  1. 相容性:差分格式局部逼近原微分方程,是方法有效的最低要求;
  2. 零稳定性:保证全局误差不会被放大,是方法收敛的必要条件;
  3. 收敛性:方法有效的最终准则,充要条件是相容+零稳定
  4. 绝对稳定性:实际计算中步长选择的核心依据,保证有限步长下计算结果可靠。

3. 工程应用核心结论

  1. 选择数值方法时,首先要保证方法相容且零稳定,否则方法一定不收敛,计算结果无意义;
  2. 实际计算中,必须根据方法的绝对稳定区间选择步长 \(h\),保证 \(h\lambda\) 落在绝对稳定区间内,否则即使方法收敛,也会因扰动放大得到错误结果;
  3. 对于刚性微分方程(\(\lambda\) 的模很大),优先选择隐式方法,其绝对稳定域更大,对步长的限制更宽松。

例9.10 辛普森方法的稳定性分析 完整推导与深度解读

本案例是常微分方程数值解法中“零稳定、收敛但绝对稳定域为空”的经典反例,核心是区分「零稳定性(理论收敛性)」与「绝对稳定性(实际计算可用性)」,以下是完整分步推导与知识点解读。


一、基础信息与前置准备

1. 辛普森方法的格式

我们研究的辛普森方法是线性二步隐式多步法,格式为:

\[y_{n+2} = y_n + \frac{h}{3}\left(f_n + 4f_{n+1} + f_{n+2}\right), \quad n=0,1,2,\dots \]

其中 \(f_{n+i}=f(x_{n+i},y_{n+i})\)\(h\) 为步长,该方法源自数值积分中的辛普森公式,是四阶精度的数值方法。

2. 线性多步法的特征多项式回顾

线性k步法的核心分析工具是两个特征多项式:

  • 第一特征多项式(齐次项):\(\rho(\xi) = \xi^k - \sum_{i=0}^{k-1}\alpha_i \xi^i\)
  • 第二特征多项式(导数项):\(\sigma(\xi) = \sum_{i=0}^k \beta_i \xi^i\)

将辛普森方法整理为线性k步法的标准形式:

\[y_{n+2} - y_n = h\left( \frac{1}{3}f_n + \frac{4}{3}f_{n+1} + \frac{1}{3}f_{n+2} \right) \]

对比标准格式,可得系数:

  • 齐次项系数:\(k=2\)\(\alpha_0=1\)\(\alpha_1=0\)
  • 导数项系数:\(\beta_0=\frac{1}{3}\)\(\beta_1=\frac{4}{3}\)\(\beta_2=\frac{1}{3}\)

二、第一步:零稳定性(收敛性)分析

1. 写出第一特征多项式

代入系数得:

\[\rho(\xi) = \xi^2 - 1 \]

2. 验证零点条件(零稳定的充要条件)

零稳定的充要条件是:\(\rho(\xi)\) 的所有零点满足 \(|\xi|\leq1\),且单位圆上的零点为单零点。

求解特征方程 \(\rho(\xi)=0\)

\[\xi^2 -1 =0 \implies \xi_1=1,\ \xi_2=-1 \]

两个根的模均为1,且均为单根,完全满足零点条件,因此辛普森方法是零稳定的

补充说明

结合辛普森方法的四阶相容性(\(p=4\geq1\)),根据Dahlquist等价定理,该方法是收敛的(理论上步长\(h\to0\)时数值解收敛到精确解)。


三、第二步:绝对稳定性分析

绝对稳定性的核心是:有限步长下,数值计算中的扰动是否会随步数指数衰减,判定依据是稳定性多项式的零点分布。

1. 写出稳定性多项式

稳定性多项式的通用形式为:

\[\pi(\xi,\mu) = \rho(\xi) - \mu \sigma(\xi), \quad \mu=h\lambda \]

其中 \(\mu\) 为复步长参数,\(\lambda\) 是测试方程 \(y'=\lambda y\) 的系数。

首先写出辛普森方法的第二特征多项式:

\[\sigma(\xi) = \frac{1}{3}\xi^2 + \frac{4}{3}\xi + \frac{1}{3} = \frac{1}{3}\left(\xi^2 +4\xi +1\right) \]

代入稳定性多项式得:

\[\pi(\xi,\mu) = \xi^2 - 1 - \frac{1}{3}\mu\left(\xi^2 +4\xi +1\right) \]

2. 求绝对稳定域的边界轨迹

绝对稳定域的边界,是稳定性多项式存在模为1的零点时 \(\mu\) 的集合。模为1的复数可表示为 \(\xi=e^{i\theta}\)\(\theta\in[0,2\pi]\)\(i\) 为虚数单位)。

\(\xi=e^{i\theta}\) 代入 \(\pi(\xi,\mu)=0\),解出边界轨迹的参数方程:

\[\rho(e^{i\theta}) - \mu \sigma(e^{i\theta}) = 0 \implies \mu(\theta) = \frac{\rho(e^{i\theta})}{\sigma(e^{i\theta})} \]

步骤1:代入多项式化简

\[\mu(\theta) = \frac{e^{i2\theta} - 1}{\frac{1}{3}\left(e^{i2\theta} +4e^{i\theta} +1\right)} = 3\cdot\frac{e^{i2\theta}-1}{e^{i2\theta}+4e^{i\theta}+1} \]

利用欧拉公式 \(e^{i\theta}=\cos\theta+i\sin\theta\),对分子分母做因式分解化简:

  • 分子:\(e^{i2\theta}-1 = e^{i\theta}\left(e^{i\theta} - e^{-i\theta}\right) = e^{i\theta}\cdot 2i\sin\theta\)
  • 分母:\(e^{i2\theta}+4e^{i\theta}+1 = e^{i\theta}\left(e^{i\theta} +4 + e^{-i\theta}\right) = e^{i\theta}\cdot\left(2\cos\theta +4\right)\)

约去公共项 \(e^{i\theta}\),最终化简得:

\[\mu(\theta) = 3\cdot\frac{2i\sin\theta}{2\cos\theta +4} = \frac{3i\sin\theta}{2+\cos\theta} \]

步骤2:分析边界轨迹的范围

从化简结果可以看出,\(\mu(\theta)\) 的实部为0,完全落在复平面的虚轴上,仅虚部随 \(\theta\) 变化。

\(f(\theta)=\frac{3\sin\theta}{2+\cos\theta}\),求其在 \(\theta\in[0,2\pi]\) 上的取值范围:

  1. 求导找极值点:\(f'(\theta)=\frac{3(2\cos\theta+1)}{(2+\cos\theta)^2}\),令 \(f'(\theta)=0\),得 \(\cos\theta=-\frac{1}{2}\),对应 \(\theta=\frac{2\pi}{3}\)\(\theta=\frac{4\pi}{3}\)
  2. 计算极值:
    • \(\theta=\frac{2\pi}{3}\) 时,\(f(\theta)=\sqrt{3}\)
    • \(\theta=\frac{4\pi}{3}\) 时,\(f(\theta)=-\sqrt{3}\)
    • 端点处 \(\theta=0,\pi,2\pi\) 时,\(f(\theta)=0\)

因此 \(f(\theta)\in[-\sqrt{3},\sqrt{3}]\),即绝对稳定域的边界 \(\partial R\)虚轴上从 \(-\sqrt{3}i\)\(\sqrt{3}i\) 的线段

3. 绝对稳定域的判定

绝对稳定域是复平面上所有使得 \(\pi(\xi,\mu)\) 的零点都满足 \(|\xi|<1\)\(\mu\) 的集合。我们通过测试点验证:

  1. \(\mu=0\):稳定性多项式退化为 \(\rho(\xi)=\xi^2-1\),零点为 \(\pm1\),模等于1,不满足绝对稳定要求;
  2. 取左半平面任意点(如 \(\mu=-1\)):求解稳定性多项式,得到零点模大于1,不稳定;
  3. 取右半平面任意点(如 \(\mu=1\)):求解稳定性多项式,得到零点模大于1,不稳定;
  4. 取虚轴上边界内的点(如 \(\mu=i\)):稳定性多项式的零点模等于1,仅在边界上,不满足绝对稳定。

综上,复平面上不存在任何使得辛普森方法绝对稳定的 \(\mu\),即辛普森方法的绝对稳定域为空集


四、最终结论与核心启示

1. 稳定性结论

  1. 辛普森方法满足零点条件,是零稳定的,结合四阶相容性,方法是收敛的(理论上 \(h\to0\) 时数值解收敛);
  2. 辛普森方法的绝对稳定域为空集,对任意步长 \(h>0\),方法都不是绝对稳定的,实际计算中扰动会随步数无限放大,数值解发散。

2. 核心工程启示

  1. 零稳定≠绝对稳定:零稳定性是 \(h\to0\) 时的理论收敛性保证,而绝对稳定性是有限步长下实际计算的可用性保证,二者不可混淆;
  2. 收敛的方法不一定实用:哪怕方法理论上收敛,若绝对稳定域过小(甚至为空),实际计算中无法找到合适的步长,最终会得到完全错误的结果;
  3. 辛普森方法的适用边界:辛普森公式在定积分数值计算中是高效的四阶方法,但在常微分方程初值问题的求解中,因绝对稳定域为空,不能用于长时间的数值积分

五、核心知识点总结表

分析维度 核心结论 判定依据
第一特征多项式 \(\rho(\xi)=\xi^2-1\) 线性二步法齐次项系数
第二特征多项式 \(\sigma(\xi)=\frac{1}{3}(\xi^2+4\xi+1)\) 导数项加权系数
零稳定性 零稳定 特征根为 \(\pm1\),满足零点条件
收敛性 收敛 四阶相容 + 零稳定,满足等价定理
稳定性多项式 \(\pi(\xi,\mu)=\xi^2-1-\frac{1}{3}\mu(\xi^2+4\xi+1)\) 绝对稳定性的核心判定工具
绝对稳定域边界 虚轴上 \([-\sqrt{3}i,\sqrt{3}i]\) 线段 边界轨迹法 \(\mu(\theta)=\frac{3i\sin\theta}{2+\cos\theta}\)
绝对稳定域 空集 复平面无满足 $
实际可用性 不可用于ODE初值问题求解 任意步长下均不绝对稳定,扰动会发散

posted on 2026-03-07 23:48  Indian_Mysore  阅读(1)  评论(0)    收藏  举报

导航