昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.3超松弛迭代法(SOR)

超松弛迭代法(SOR)详细讲解与推导

一、迭代法的核心基础框架

对于n阶线性方程组 \(Ax=b\),迭代法的核心思想是对系数矩阵做分裂\(A = M - N\),其中\(M\)为非奇异矩阵(称为分裂矩阵)。由此构造迭代格式:

\[Mx^{(k+1)} = Nx^{(k)} + b \]

两边左乘\(M^{-1}\),得到标准迭代形式:

\[x^{(k+1)} = L x^{(k)} + f \]

其中:

  • 迭代矩阵 \(L = M^{-1}N\),决定迭代的收敛性与收敛速度;
  • 常数项 \(f = M^{-1}b\)

迭代法收敛的充要条件:迭代矩阵的谱半径 \(\rho(L) < 1\)(谱半径为矩阵所有特征值的模的最大值)。

为了简化迭代构造,对系数矩阵\(A\)做标准的D-L-U分解

\[A = D - L - U \]

其中:

  • \(D\):对角矩阵,\(D = \text{diag}(a_{11},a_{22},\dots,a_{nn})\),要求\(a_{ii} \neq 0\)(保证迭代可计算);
  • \(L\):严格下三角矩阵,对角线元素全为0,当\(i>j\)\(L_{ij}=-a_{ij}\),其余为0;
  • \(U\):严格上三角矩阵,对角线元素全为0,当\(i<j\)\(U_{ij}=-a_{ij}\),其余为0。

高斯-塞德尔(GS)迭代就是基于该分解的经典迭代法,而超松弛迭代法(SOR)是GS迭代的推广与修正,核心是引入松弛因子优化收敛速度。


二、SOR迭代法的构造与完整推导

2.1 松弛思想的来源

GS迭代的核心是用已更新的分量计算新值,分量格式为:

\[\tilde{x}_i^{(k+1)} = \frac{1}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^n a_{ij}x_j^{(k)} \right) \]

SOR迭代在GS迭代的基础上,引入松弛因子\(\omega>0\),对旧值\(x_i^{(k)}\)和GS迭代的辅助值\(\tilde{x}_i^{(k+1)}\)做加权平均,得到新的迭代值:

\[x_i^{(k+1)} = (1-\omega)x_i^{(k)} + \omega \tilde{x}_i^{(k+1)} \]

该式也可写成增量形式,更直观体现“松弛”的含义:

\[x_i^{(k+1)} = x_i^{(k)} + \omega\left( \tilde{x}_i^{(k+1)} - x_i^{(k)} \right) \]

即:新值 = 旧值 + 松弛因子×GS迭代的增量,通过调整\(\omega\)控制更新步长,优化收敛速度。

2.2 SOR分量计算公式的推导

将GS辅助值代入加权平均公式,展开推导:

\[\begin{align*} x_i^{(k+1)} &= (1-\omega)x_i^{(k)} + \frac{\omega}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^n a_{ij}x_j^{(k)} \right) \\ &= x_i^{(k)} - \omega x_i^{(k)} + \frac{\omega}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^n a_{ij}x_j^{(k)} \right) \\ &= x_i^{(k)} + \frac{\omega}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i}^n a_{ij}x_j^{(k)} \right) \end{align*} \]

最终得到SOR迭代的分量计算公式(计算机实现的核心格式):

\[\begin{cases} x^{(0)} = (x_1^{(0)},x_2^{(0)},\dots,x_n^{(0)})^T \quad (\text{初始向量}) \\ x_i^{(k+1)} = x_i^{(k)} + \frac{\omega}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i}^n a_{ij}x_j^{(k)} \right) \\ i=1,2,\dots,n,\quad k=0,1,2,\dots \end{cases} \]

2.3 SOR矩阵形式与分裂矩阵的推导

将分量公式两边乘以\(a_{ii}\),整理得:

\[a_{ii}x_i^{(k+1)} + \omega\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} = a_{ii}x_i^{(k)} - \omega\sum_{j=i}^n a_{ij}x_j^{(k)} + \omega b_i \]

结合D-L-U分解的定义,将上式转化为矩阵形式:

  • 左边:\((D - \omega L)x^{(k+1)}\)\(D-\omega L\)为下三角矩阵,对角元为\(a_{ii}\neq0\),可逆);
  • 右边:\(\left[(1-\omega)D + \omega U\right]x^{(k)} + \omega b\)

因此得到矩阵等式:

\[(D - \omega L)x^{(k+1)} = \left[(1-\omega)D + \omega U\right]x^{(k)} + \omega b \]

两边左乘\((D - \omega L)^{-1}\),得到SOR迭代的标准矩阵格式

\[x^{(k+1)} = L_\omega x^{(k)} + f \]

其中:

  1. 迭代矩阵:\(\boldsymbol{L_\omega = (D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]}\)
  2. 常数项:\(\boldsymbol{f = \omega (D - \omega L)^{-1}b}\)

对比迭代法的通用分裂形式\(A=M-N\),可推导出SOR的分裂矩阵:
\(M^{-1} = \omega (D - \omega L)^{-1}\),得分裂矩阵

\[\boldsymbol{M = \frac{1}{\omega}(D - \omega L)} \]

这就是教材中分裂矩阵的来源,而非凭空定义。


三、SOR迭代的分类与特殊情况

  1. \(\omega=1\)
    迭代矩阵退化为\(L_1=(D-L)^{-1}U\),与高斯-塞德尔迭代的迭代矩阵完全一致。因此GS迭代是SOR迭代在\(\omega=1\)时的特例,SOR是GS迭代的推广。

  2. 按松弛因子的分类

    • \(\omega>1\)超松弛迭代,放大GS迭代的更新步长,用于加速收敛(是SOR最常用的场景);
    • \(\omega<1\)低松弛(亚松弛)迭代,缩小更新步长,用于改善迭代的稳定性,让原本不收敛的迭代变得收敛;
    • \(\omega=1\):高斯-塞德尔迭代。

四、SOR迭代的收敛性理论与证明

4.1 收敛的充要条件

SOR迭代收敛的充要条件是迭代矩阵的谱半径满足:

\[\boldsymbol{\rho(L_\omega) < 1} \]

该条件是所有迭代法收敛的通用充要条件,对SOR迭代完全适用。

4.2 收敛的必要条件(核心定理)

定理:SOR迭代收敛的必要条件是松弛因子满足 \(\boldsymbol{0 < \omega < 2}\)

严格证明:

矩阵的行列式等于其所有特征值的乘积,因此对迭代矩阵\(L_\omega\),有:

\[\det(L_\omega) = \prod_{i=1}^n \lambda_i \]

其中\(\lambda_i\)\(L_\omega\)的特征值。

分别计算行列式的两部分:

  1. \(\det\left((D - \omega L)^{-1}\right) = \frac{1}{\det(D - \omega L)}\)
    \(D-\omega L\)是下三角矩阵,行列式等于对角元的乘积,即\(\det(D-\omega L)=\det(D)\),因此\(\det\left((D - \omega L)^{-1}\right) = \frac{1}{\det(D)}\)

  2. \(\det\left((1-\omega)D + \omega U\right)\)
    \((1-\omega)D + \omega U\)是上三角矩阵,行列式等于对角元的乘积,对角元为\((1-\omega)a_{ii}\),因此:

    \[\det\left((1-\omega)D + \omega U\right) = \prod_{i=1}^n (1-\omega)a_{ii} = (1-\omega)^n \det(D) \]

因此迭代矩阵的行列式为:

\[\det(L_\omega) = \frac{1}{\det(D)} \cdot (1-\omega)^n \det(D) = (1-\omega)^n \]

若SOR迭代收敛,则\(\rho(L_\omega)<1\),即所有特征值的模\(|\lambda_i|<1\),因此:

\[|\det(L_\omega)| = \prod_{i=1}^n |\lambda_i| < 1 \]

代入行列式结果得:

\[|1-\omega|^n < 1 \implies |1-\omega| < 1 \]

解不等式得:\(\boldsymbol{0 < \omega < 2}\)

重要结论:若\(\omega\)不在\((0,2)\)区间内,SOR迭代一定不收敛;只有\(\omega\in(0,2)\)时,迭代才有可能收敛。该条件是收敛的前提,是选择松弛因子的基础。

4.3 对称正定矩阵的收敛充分条件

定理:若系数矩阵\(A\)是对称正定矩阵,且\(0<\omega<2\),则SOR迭代一定收敛。

该定理是工程中最常用的结论(有限元、有限差分法得到的线性方程组多为对称正定矩阵),证明如下:

严格证明:

要证明SOR收敛,只需证明\(L_\omega\)的任意特征值\(\lambda\)都满足\(|\lambda|<1\)

\(\lambda\)\(L_\omega\)的任意特征值,\(x\)为对应的特征向量,即\(L_\omega x = \lambda x\),代入\(L_\omega\)的定义得:

\[(D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]x = \lambda x \]

两边左乘\((D - \omega L)\),整理得:

\[\left[(1-\omega)D + \omega U\right]x = \lambda (D - \omega L)x \tag{1} \]

由于\(A\)是对称矩阵,\(A=A^T\),结合\(A=D-L-U\),可得\(U=L^T\)\(L\)的转置等于\(U\))。

对式(1)两边左乘\(x\)的共轭转置\(x^H\)(处理复数特征值),记:

  • \(\alpha = x^H D x\)\(D\)是正定对角矩阵(对称正定矩阵的对角元恒正),因此\(\alpha>0\)
  • \(\beta = x^H L x\),则\(x^H U x = x^H L^T x = \overline{\beta}\)\(\beta\)的共轭复数)。

式(1)可改写为:

\[(1-\omega)\alpha + \omega \overline{\beta} = \lambda (\alpha - \omega \beta) \tag{2} \]

解出\(\lambda\)并计算模的平方:

\[\lambda = \frac{(1-\omega)\alpha + \omega \overline{\beta}}{\alpha - \omega \beta} \]

\[|\lambda|^2 = \frac{\left[(1-\omega)\alpha + \omega \overline{\beta}\right] \cdot \left[(1-\omega)\alpha + \omega \beta\right]}{(\alpha - \omega \beta) \cdot (\alpha - \omega \overline{\beta})} \tag{3} \]

利用\(A\)的正定性:\(x^H A x = \alpha - \beta - \overline{\beta} > 0\),记\(S=\beta+\overline{\beta}\),则\(S < \alpha\)

将式(3)的分子\(N\)与分母\(DEN\)展开并做差:

\[\begin{align*} N - DEN &= (1-\omega)^2\alpha^2 + \omega(1-\omega)\alpha S + \omega^2|\beta|^2 - \left(\alpha^2 - \omega \alpha S + \omega^2|\beta|^2\right) \\ &= \omega(2-\omega)\alpha (S - \alpha) \end{align*} \]

分析各项符号:

  • \(0<\omega<2\),因此\(\omega(2-\omega)>0\)
  • \(\alpha>0\)\(S-\alpha<0\)

因此\(N-DEN < 0\),即\(N < DEN\)。同时分母\(DEN=|\alpha - \omega \beta|^2>0\)(若\(DEN=0\)则与\(S<\alpha\)矛盾),因此:

\[|\lambda|^2 = \frac{N}{DEN} < 1 \implies |\lambda| < 1 \]

由于\(\lambda\)\(L_\omega\)的任意特征值,因此\(\rho(L_\omega)<1\),SOR迭代收敛。


五、最佳松弛因子与收敛加速

SOR迭代的收敛速度高度依赖松弛因子\(\omega\)的选择,最佳松弛因子\(\omega_{opt}\)是使\(\rho(L_\omega)\)最小的\(\omega\),此时迭代收敛速度最快。

5.1 适用场景

对于具有性质A(2-循环矩阵)相容次序的矩阵(如五点差分法解泊松方程得到的矩阵,是工程中最常见的场景),有严格的最佳松弛因子计算公式。

5.2 计算公式

记雅可比迭代矩阵\(J=D^{-1}(L+U)\)的谱半径为\(\mu=\rho(J)\)(要求\(\mu<1\),即雅可比迭代收敛),则:

\[\boldsymbol{\omega_{opt} = \frac{2}{1+\sqrt{1-\mu^2}}} \]

此时迭代矩阵的最小谱半径为:

\[\rho(L_{\omega_{opt}}) = \omega_{opt} - 1 \]

5.3 实例验证

以教材例6.8的矩阵为例,雅可比迭代矩阵的谱半径\(\mu=0.75\),代入公式得\(\omega_{opt}\approx1.204\),与实际测试的最优值\(\omega=1.3\)接近,验证了公式的有效性。实际工程中,可通过小规模测试或经验公式确定\(\omega_{opt}\),大幅减少迭代次数。


六、SOR迭代的计算机实现流程

  1. 输入:系数矩阵\(A\)、右端向量\(b\)、初始向量\(x_0\)、松弛因子\(\omega\)、收敛精度\(\varepsilon\)、最大迭代次数\(N_{max}\)
  2. 初始化:迭代次数\(k=0\),当前迭代值\(x=x_0\)
  3. 迭代循环
    • \(i=1\)\(n\),依次计算:
      1. 已更新分量和:\(sum1 = \sum_{j=1}^{i-1}a_{ij}x_j\)
      2. 未更新分量和:\(sum2 = \sum_{j=i}^n a_{ij}x_j\)
      3. 增量:\(\Delta x_i = \frac{\omega}{a_{ii}}(b_i - sum1 - sum2)\)
      4. 更新分量:\(x_i = x_i + \Delta x_i\)
    • 计算收敛判据:\(\max|\Delta x_i| < \varepsilon\)\(\|b-Ax\|_\infty < \varepsilon\)
    • 若满足精度,输出\(x\),迭代结束;否则\(k=k+1\),若\(k>N_{max}\),输出迭代失败,结束循环。

七、SOR迭代法核心知识点总结表

分类 核心内容 关键公式/结论
核心定义 迭代格式 \(x^{(k+1)} = L_\omega x^{(k)} + f\)
迭代矩阵 \(L_\omega = (D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]\)
分裂矩阵 \(M = \frac{1}{\omega}(D - \omega L)\)
分量计算公式 \(x_i^{(k+1)} = x_i^{(k)} + \frac{\omega}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i}^n a_{ij}x_j^{(k)} \right)\)
特殊情况 \(\omega=1\) 退化为高斯-塞德尔迭代
\(\omega>1\) 超松弛迭代,用于加速收敛
\(\omega<1\) 低松弛迭代,用于改善稳定性
收敛性理论 收敛充要条件 \(\rho(L_\omega) < 1\)
收敛必要条件 \(0 < \omega < 2\)(不满足则一定不收敛)
对称正定矩阵收敛充分条件 \(A\)对称正定 + \(0<\omega<2\) → SOR一定收敛
收敛加速 最佳松弛因子(2-循环相容次序矩阵) \(\omega_{opt} = \frac{2}{1+\sqrt{1-\mu^2}}\)\(\mu=\rho(J)\)(雅可比谱半径)
最优谱半径 \(\rho(L_{\omega_{opt}}) = \omega_{opt} - 1\)
工程特性 存储需求 仅需1个数组存储迭代值,与GS迭代一致,内存占用低
计算量 单次迭代计算量与雅可比、GS迭代相当,收敛速度远优于二者(选对\(\omega\)时)
适用场景 大型稀疏线性方程组(如偏微分方程数值解、有限元分析)

SOR迭代法收敛性理论 深度讲解与完整推导

承接上一节SOR迭代法的构造,本节是SOR方法的核心理论基础,解决三个关键问题:

  1. SOR迭代收敛的前提条件是什么?
  2. 什么情况下能保证SOR迭代一定收敛?
  3. 如何选择松弛因子让SOR迭代收敛速度最快?

一、前置基础回顾

对于线性方程组 \(Ax=b\),SOR迭代的核心形式为:

\[x^{(k+1)} = L_\omega x^{(k)} + f \]

其中迭代矩阵:

\[L_\omega = (D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right] \]

\(A=D-L-U\) 为系数矩阵的D-L-U分解(\(D\)为对角矩阵,\(L\)为严格下三角矩阵,\(U\)为严格上三角矩阵)。

迭代法收敛的充要条件:迭代矩阵的谱半径 \(\boldsymbol{\rho(L_\omega) < 1}\)(谱半径为矩阵所有特征值模的最大值)。所有收敛性定理均围绕该充要条件展开。


二、定理6.10:SOR迭代收敛的必要条件

定理内容

若解 \(Ax=b\) 的SOR迭代法收敛,则松弛因子必然满足 \(\boldsymbol{0 < \omega < 2}\)

完整证明拆解

步骤1:从收敛性得到行列式的约束

SOR迭代收敛 → 满足收敛充要条件 \(\rho(L_\omega) < 1\)

\(L_\omega\)\(n\) 个特征值为 \(\lambda_1,\lambda_2,\dots,\lambda_n\),根据矩阵行列式的性质:矩阵的行列式等于所有特征值的乘积,即:

\[\det(L_\omega) = \lambda_1 \lambda_2 \dots \lambda_n \]

对等式两边取模,得:

\[|\det(L_\omega)| = |\lambda_1 \lambda_2 \dots \lambda_n| = \prod_{i=1}^n |\lambda_i| \]

根据谱半径的定义,\(\rho(L_\omega) = \max_{1\leq i\leq n} |\lambda_i|\),因此所有特征值的模都满足 \(|\lambda_i| \leq \rho(L_\omega)\),代入乘积得:

\[|\det(L_\omega)| = \prod_{i=1}^n |\lambda_i| \leq \left[\rho(L_\omega)\right]^n \]

由于迭代收敛,\(\rho(L_\omega) < 1\),因此 \(\left[\rho(L_\omega)\right]^n < 1\),最终得到核心约束:

\[|\det(L_\omega)| < 1 \]

步骤2:计算迭代矩阵的行列式

根据矩阵行列式的性质:\(\det(AB)=\det(A)\det(B)\)\(\det(A^{-1})=1/\det(A)\),对 \(L_\omega\) 拆分计算:

\[\det(L_\omega) = \det\left[(D - \omega L)^{-1}\right] \cdot \det\left[(1-\omega)D + \omega U\right] \]

分别计算两部分的行列式:

  1. \(\det\left[(D - \omega L)^{-1}\right]\)
    \(D-\omega L\)下三角矩阵\(D\)为对角矩阵,\(L\)为严格下三角矩阵),下三角矩阵的行列式等于对角元的乘积。
    \(D-\omega L\) 的对角元与 \(D\) 完全一致(\(L\)的对角元为0),因此 \(\det(D-\omega L)=\det(D)\),故:

    \[\det\left[(D - \omega L)^{-1}\right] = \frac{1}{\det(D)} \]

  2. \(\det\left[(1-\omega)D + \omega U\right]\)
    \((1-\omega)D + \omega U\)上三角矩阵\(D\)为对角矩阵,\(U\)为严格上三角矩阵),上三角矩阵的行列式同样等于对角元的乘积。
    该矩阵的对角元为 \((1-\omega)a_{ii}\)\(U\)的对角元为0),因此:

    \[\det\left[(1-\omega)D + \omega U\right] = \prod_{i=1}^n (1-\omega)a_{ii} = (1-\omega)^n \cdot \det(D) \]

步骤3:合并得到最终结论

将两部分行列式合并,\(\det(D)\) 相互抵消:

\[\det(L_\omega) = \frac{1}{\det(D)} \cdot (1-\omega)^n \cdot \det(D) = (1-\omega)^n \]

结合步骤1的约束 \(|\det(L_\omega)| < 1\),得:

\[|1-\omega|^n < 1 \]

两边开 \(n\) 次方(\(n\)为正整数,不改变不等号方向):

\[|1-\omega| < 1 \]

解该绝对值不等式:

\[-1 < 1-\omega < 1 \]

  • 左半部分:\(1-\omega > -1 \implies \omega < 2\)
  • 右半部分:\(1-\omega < 1 \implies \omega > 0\)

最终得到:\(\boldsymbol{0 < \omega < 2}\),定理得证。

定理核心解读

  1. 这是SOR迭代收敛的硬约束:只要 \(\omega\) 不在 \((0,2)\) 区间内,无论系数矩阵 \(A\) 是什么形式,SOR迭代一定发散。
  2. 该条件是必要非充分条件\(\omega\in(0,2)\) 不能保证迭代一定收敛,只是收敛的前提。

三、定理6.11:对称正定矩阵的收敛充分条件

该定理是工程中最常用的收敛性判定准则,有限元、有限差分法求解椭圆型方程得到的系数矩阵,大多为对称正定矩阵。

定理内容

若线性方程组 \(Ax=b\) 满足以下两个条件:

  1. 系数矩阵 \(A\)对称正定矩阵,且 \(A=D-L-U\)
  2. 松弛因子满足 \(\boldsymbol{0 < \omega < 2}\)

则解 \(Ax=b\) 的SOR迭代法一定收敛

完整证明拆解

证明思路

要证明SOR迭代收敛,只需证明:\(L_\omega\)任意一个特征值 \(\lambda\) 都满足 \(|\lambda| < 1\),即可推出 \(\rho(L_\omega) < 1\),满足收敛充要条件。

步骤1:从特征值定义出发,消去逆矩阵

\(\lambda\)\(L_\omega\) 的任意一个特征值,\(y\) 为对应的非零特征向量,即:

\[L_\omega y = \lambda y, \quad y=(y_1,y_2,\dots,y_n)^T \neq 0 \]

代入 \(L_\omega\) 的定义:

\[(D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]y = \lambda y \]

两边左乘 \((D - \omega L)\) 消去逆矩阵,得到核心等式:

\[\left[(1-\omega)D + \omega U\right]y = \lambda (D - \omega L)y \tag{1} \]

步骤2:引入内积,推导特征值表达式

对等式(1)两边同时与特征向量 \(y\)欧氏内积(内积定义:\((x,y)=x^H y\)\(H\)为共轭转置,用于处理复数特征值),得:

\[\left( \left[(1-\omega)D + \omega U\right]y, y \right) = \lambda \left( (D - \omega L)y, y \right) \]

根据内积的线性性质,将常数项提出,整理得到 \(\lambda\) 的表达式:

\[\lambda = \frac{(1-\omega)(Dy,y) + \omega(Uy,y)}{(Dy,y) - \omega(Ly,y)} \tag{2} \]

步骤3:利用对称正定矩阵的性质,化简内积

  1. \((Dy,y)\) 的正定性
    \(A\) 是对称正定矩阵,因此其对角元 \(a_{ii} > 0\)(正定矩阵的必要条件)。展开内积:

    \[(Dy,y) = \sum_{i=1}^n a_{ii} |y_i|^2 \]

    由于 \(y \neq 0\)\(a_{ii} > 0\),因此该和式一定为正,记 \(\boldsymbol{\sigma = (Dy,y) > 0}\)

  2. \(U=L^T\) 的对称性
    \(A\) 是对称矩阵,即 \(A=A^T\)。结合 \(A=D-L-U\),得:

    \[A^T = D^T - L^T - U^T = D - L^T - U^T = A = D - L - U \]

    因此推出 \(\boldsymbol{U=L^T}\)(严格下三角矩阵的转置为严格上三角矩阵)。

  3. 内积的共轭性质
    \(-(Ly,y) = \alpha + i\beta\)\(\alpha,\beta\) 为实数,\(i\) 为虚数单位),根据内积的共轭性质 \((A^T x,y) = (x,Ay)\),得:

    \[(Uy,y) = (L^T y,y) = (y,Ly) = \overline{(Ly,y)} \]

    其中 \(\overline{z}\) 表示复数 \(z\) 的共轭。代入 \(-(Ly,y)=\alpha+i\beta\),得:

    \[(Uy,y) = \overline{-\alpha -i\beta} = -\alpha + i\beta \]

  4. 正定带来的核心不等式
    \(A\) 是正定矩阵,因此 \((Ay,y) > 0\)。展开 \(A=D-L-U\)

    \[(Ay,y) = (Dy,y) - (Ly,y) - (Uy,y) = \sigma - (Ly,y) - (Uy,y) \]

    代入 \((Ly,y)=-\alpha-i\beta\)\((Uy,y)=-\alpha+i\beta\),两者相加抵消虚部,得:

    \[(Ay,y) = \sigma + 2\alpha > 0 \]

步骤4:计算 \(|\lambda|^2\),证明其小于1

将上述化简结果代入式(2),得到 \(\lambda\) 的复数形式:

\[\lambda = \frac{\sigma(1-\omega) - \omega\alpha + i\omega\beta}{\sigma + \omega\alpha + i\omega\beta} \]

对于复数 \(z=\frac{a+ib}{c+id}\),其模的平方满足 \(|z|^2 = \frac{a^2+b^2}{c^2+d^2}\),因此:

\[|\lambda|^2 = \frac{\left[\sigma(1-\omega) - \omega\alpha\right]^2 + (\omega\beta)^2}{(\sigma + \omega\alpha)^2 + (\omega\beta)^2} \tag{3} \]

要证明 \(|\lambda| < 1\),只需证明 \(|\lambda|^2 < 1\),即证明分子 < 分母,等价于证明:

\[\left[\sigma(1-\omega) - \omega\alpha\right]^2 + (\omega\beta)^2 - \left[(\sigma + \omega\alpha)^2 + (\omega\beta)^2\right] < 0 \]

其中 \((\omega\beta)^2\) 相互抵消,剩余部分为平方差形式,利用 \(a^2-b^2=(a-b)(a+b)\) 展开:

\[\begin{align*} \Delta &= \left[\sigma(1-\omega) - \omega\alpha\right]^2 - (\sigma + \omega\alpha)^2 \\ &= \left[\sigma(1-\omega) - \omega\alpha - \sigma - \omega\alpha\right] \cdot \left[\sigma(1-\omega) - \omega\alpha + \sigma + \omega\alpha\right] \\ &= \left[-\omega\sigma - 2\omega\alpha\right] \cdot \left[2\sigma - \omega\sigma\right] \\ &= -\omega \cdot (\sigma + 2\alpha) \cdot \sigma \cdot (2-\omega) \end{align*} \]

分析 \(\Delta\) 的符号:

  • \(0<\omega<2\)\(\omega>0\)\(2-\omega>0\)
  • \(\sigma>0\)(已证);
  • \(\sigma+2\alpha>0\)(正定带来的核心不等式);

所有正数相乘后带负号,因此 \(\boldsymbol{\Delta < 0}\),即分子 < 分母,代入式(3)得:

\[|\lambda|^2 < 1 \implies |\lambda| < 1 \]

由于 \(\lambda\)\(L_\omega\) 的任意特征值,因此 \(\rho(L_\omega) < 1\),SOR迭代收敛,定理得证。

定理核心解读

  1. 这是充分非必要条件:只要满足对称正定+0<ω<2,迭代一定收敛;但迭代收敛不代表矩阵一定对称正定。
  2. 工程价值极高:对于结构力学、流体力学、热传导等问题离散得到的对称正定矩阵,只需选择0<ω<2,即可保证迭代收敛,无需额外判定。

四、定理6.12:对角占优矩阵的收敛充分条件

定理内容

若线性方程组 \(Ax=b\) 满足以下两个条件:

  1. 系数矩阵 \(A\)严格对角占优矩阵,或弱对角占优且不可约矩阵
  2. 松弛因子满足 \(\boldsymbol{0 < \omega \leq 1}\)

则解 \(Ax=b\) 的SOR迭代法一定收敛

核心概念与定理解读

  1. 对角占优定义

    • 严格对角占优:对矩阵的每一行 \(i\),都满足 \(|a_{ii}| > \sum_{j\neq i} |a_{ij}|\)
    • 弱对角占优:对每一行 \(i\),都满足 \(|a_{ii}| \geq \sum_{j\neq i} |a_{ij}|\),且至少存在一行严格大于;
    • 不可约矩阵:无法通过行、列置换变为分块上三角矩阵,对应方程组无法拆分为独立的小方程组。
  2. 与对称正定定理的核心区别:
    对松弛因子的限制更严格,仅当 \(0<\omega\leq1\) 时能保证收敛;若 \(\omega>1\)(超松弛),则无法保证收敛,需额外条件。

  3. 适用场景:
    差分法求解偏微分方程得到的矩阵大多为对角占优矩阵,该定理可直接判定低松弛、GS迭代(ω=1)的收敛性。


五、SOR迭代的最佳松弛因子

SOR迭代的收敛速度由 \(\rho(L_\omega)\) 决定,\(\rho(L_\omega)\) 越小,收敛速度越快。最佳松弛因子 \(\omega_{opt}\) 是使 \(\rho(L_\omega)\) 取最小值的松弛因子,即:

\[\omega_{opt} = \arg\min_{0<\omega<2} \rho(L_\omega) \]

1. 适用条件

对于具有性质A(2-循环矩阵)相容次序的矩阵(工程中最常见的是五点差分法离散泊松方程得到的矩阵),有严格的最佳松弛因子计算公式。

2. 最佳松弛因子公式

\[\boldsymbol{\omega_{opt} = \frac{2}{1 + \sqrt{1 - [\rho(J)]^2}}} \]

其中:

  • \(\rho(J)\) 为雅可比迭代矩阵 \(J=D^{-1}(L+U)\) 的谱半径;
  • 要求雅可比迭代收敛,即 \(\rho(J) < 1\)

3. 核心结论

当取最佳松弛因子时,迭代矩阵的最小谱半径为:

\[\rho(L_{\omega_{opt}}) = \omega_{opt} - 1 \]

4. 实例验证

以教材例6.8的矩阵为例,雅可比迭代矩阵的谱半径 \(\rho(J)=0.75\),代入公式得:

\[\omega_{opt} = \frac{2}{1+\sqrt{1-0.75^2}} \approx 1.204 \]

与实际测试的最优值 \(\omega=1.3\) 高度吻合,验证了公式的有效性。此时 \(\rho(L_{\omega_{opt}})\approx0.204\),远小于GS迭代(ω=1)的谱半径 \(\rho(J)^2=0.5625\),收敛速度提升超2倍。


六、SOR迭代收敛性核心定理总结表

定理编号 核心条件 结论 条件类型 核心适用场景 关键注意事项
定理6.10 SOR迭代收敛 必有 \(0<\omega<2\) 必要条件 所有SOR迭代的前提 ω∉(0,2)时迭代一定发散
定理6.11 1. \(A\) 对称正定;2. \(0<\omega<2\) SOR迭代一定收敛 充分条件 有限元、结构力学等对称正定方程组 是工程中最常用的收敛判定准则
定理6.12 1. \(A\) 严格对角占优/弱对角占优不可约;2. \(0<\omega\leq1\) SOR迭代一定收敛 充分条件 差分法离散偏微分方程得到的对角占优方程组 ω>1时无法保证收敛
最佳松弛因子公式 1. \(A\) 具有性质A、相容次序;2. 雅可比迭代收敛 可计算出收敛最快的 \(\omega_{opt}\) 优化公式 五点差分法等规则网格离散的方程组 需先计算雅可比迭代的谱半径

块迭代法(分块迭代法)深度讲解与完整推导

块迭代法是点迭代法(雅可比、GS、SOR)向分块矩阵的推广,核心是将大型稀疏矩阵按结构分块,把每个子块当作“标量元素”,类比点迭代的构造逻辑设计迭代格式。它专为工程中大规模稀疏线性方程组(如偏微分方程离散、有限元分析)设计,核心优势是利用矩阵的分块稀疏性提升计算效率、加快收敛速度,是科学计算中求解大型线性方程组的核心方法之一。


一、前置背景:块迭代法的经典应用场景——泊松方程五点差分格式

块迭代法最典型的应用是二维泊松方程边值问题的数值求解,我们先从微分方程离散出发,完整推导差分格式与矩阵分块结构,为块迭代法的讲解建立工程实例基础。

1.1 模型问题与网格剖分

考虑二维泊松方程齐次Dirichlet边值问题:

\[\begin{cases} -\left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right) = f(x,y), & (x,y) \in \Omega \\ u(x,y) = 0, & (x,y) \in \partial\Omega \end{cases} \]

其中求解区域为单位正方形 \(\Omega = [0,1] \times [0,1]\)\(\partial\Omega\) 为区域边界。

网格剖分

取等步长 \(h = \frac{1}{N+1}\),用直线 \(x_i = ih\)\(y_j = jh\)\(i,j=0,1,\dots,N+1\))对区域做网格剖分:

  • 网格内点:\(\Omega_h = \{(x_i,y_j) \mid i,j=1,2,\dots,N\}\),共 \(N^2\) 个未知量;
  • 边界点:\(\partial\Omega_h = \{(x_i,0),(x_i,1),(0,y_j),(1,y_j) \mid i,j=0,1,\dots,N+1\}\),边界上 \(u=0\)(齐次边界条件)。

1.2 二阶偏导数的中心差分近似

二阶偏导数的中心差分格式具有二阶精度(截断误差 \(O(h^2)\)),在网格点 \((x_i,y_j)\) 处:

\[\left. \frac{\partial^2 u}{\partial x^2} \right|_{(x_i,y_j)} = \frac{u(x_{i+1},y_j) - 2u(x_i,y_j) + u(x_{i-1},y_j)}{h^2} + o(h^2) \]

\[\left. \frac{\partial^2 u}{\partial y^2} \right|_{(x_i,y_j)} = \frac{u(x_i,y_{j+1}) - 2u(x_i,y_j) + u(x_i,y_{j-1})}{h^2} + o(h^2) \]

1.3 五点差分格式的推导

略去截断误差 \(o(h^2)\),记 \(u_{ij}\)\(u(x_i,y_j)\) 的近似值,\(f_{ij}=f(x_i,y_j)\),将差分代入泊松方程:

\[- \left( \frac{u_{i+1,j} - 2u_{ij} + u_{i-1,j}}{h^2} + \frac{u_{i,j+1} - 2u_{ij} + u_{i,j-1}}{h^2} \right) = f_{ij} \]

两边同乘 \(h^2\) 并整理,得到泊松方程的五点差分格式

\[\boldsymbol{4u_{ij} - u_{i+1,j} - u_{i-1,j} - u_{i,j+1} - u_{i,j-1} = h^2 f_{ij}} \tag{6.27} \]

该格式的物理意义:每个网格点的函数值仅与上下左右4个相邻点相关,因此离散后的线性方程组系数矩阵是稀疏矩阵,每行最多5个非零元素。

1.4 差分方程的矩阵形式与分块结构

将网格点按逐行自然序排列(先排 \(y=y_1\) 行的 \(u_{11},u_{21},\dots,u_{N1}\),再排 \(y=y_2\) 行,直到 \(y=y_N\) 行),构造未知向量与右端向量:

\[\boldsymbol{u} = (u_{11},u_{21},\dots,u_{N1},u_{12},u_{22},\dots,u_{NN})^T \in \mathbb{R}^{N^2} \]

\[\boldsymbol{b} = h^2(f_{11},f_{21},\dots,f_{N1},f_{12},f_{22},\dots,f_{NN})^T \in \mathbb{R}^{N^2} \]

差分方程可写成矩阵形式 \(\boldsymbol{Au=b}\),其中系数矩阵 \(\boldsymbol{A}\) 具有块三对角分块结构

\[A = \begin{pmatrix} A_{11} & -I & & \\ -I & A_{22} & -I & \\ & \ddots & \ddots & \ddots & \\ & & -I & A_{N-1,N-1} & -I \\ & & & -I & A_{NN} \end{pmatrix} \in \mathbb{R}^{N^2 \times N^2} \tag{6.29} \]

其中:

  1. \(I\)\(N \times N\) 单位矩阵,对应相邻行网格点的耦合关系(\(u_{i,j+1}\)\(u_{ij}\) 的关联);
  2. 主对角块 \(A_{ii}\)\(N \times N\) 三对角矩阵,对应同一行内网格点的耦合关系:

    \[A_{ii} = \begin{pmatrix} 4 & -1 & & \\ -1 & 4 & -1 & \\ & \ddots & \ddots & \ddots & \\ & & -1 & 4 & -1 \\ & & & -1 & 4 \end{pmatrix} \in \mathbb{R}^{N \times N}, \quad i=1,2,\dots,N \tag{6.30} \]

1.5 点迭代法的谱半径与收敛速度分析

该模型问题是验证迭代法收敛速度的经典算例,我们先推导点迭代的核心参数,为后续块迭代的优势对比建立基准。

(1)雅可比迭代矩阵的谱半径

雅可比迭代矩阵定义为 \(J = D^{-1}(L+U)\),其中 \(D\)\(A\) 的对角矩阵(对角元全为4)。利用分离变量法可求得 \(J\) 的特征值:

\[\mu_{ij} = \frac{1}{2}\left( \cos i\pi h + \cos j\pi h \right), \quad i,j=1,2,\dots,N \]

谱半径为特征值模的最大值,当 \(i=j=1\) 时取得最大值:

\[\boldsymbol{\mu = \rho(J) = \cos \pi h} \]

\(h \to 0\)(网格加密)时,\(\cos \pi h \approx 1 - \frac{1}{2}\pi^2 h^2\),谱半径趋近于1,雅可比迭代收敛速度极慢。

(2)SOR迭代的最佳松弛因子

该模型问题的系数矩阵 \(A\) 是对称正定矩阵,且满足“性质A”与相容次序,因此可使用最佳松弛因子公式:

\[\omega_{opt} = \frac{2}{1 + \sqrt{1 - \rho(J)^2}} \]

代入 \(\rho(J)=\cos \pi h\),利用三角恒等式 \(\sqrt{1-\cos^2 \pi h}=\sin \pi h\),化简得:

\[\boldsymbol{\omega_{opt} = \frac{2}{1 + \sin \pi h}} \]

此时SOR迭代矩阵的最小谱半径为:

\[\rho(L_{\omega_{opt}}) = \omega_{opt} - 1 = \frac{1 - \sin \pi h}{1 + \sin \pi h} = \frac{\cos^2 \pi h}{(1 + \sin \pi h)^2} \]

(3)渐近收敛速度对比

迭代法的渐近收敛速度定义为 \(R(B) = -\ln \rho(B)\)\(R\) 越大,收敛速度越快。

  • 雅可比迭代:\(R(J) = -\ln \cos \pi h \approx \frac{1}{2}\pi^2 h^2 + o(h^4)\),收敛速度为 \(O(h^2)\)
  • 最佳SOR迭代:\(R(L_{\omega_{opt}}) = -\ln (\omega_{opt}-1) \approx 2\pi h + o(h^3)\),收敛速度为 \(O(h)\)

核心结论:最佳SOR迭代的收敛速度比雅可比迭代高一个数量级,网格越密,优势越明显。

  • 实例验证:取 \(h=0.05\)\(N=19\)),收敛精度 \(10^{-6}\),雅可比迭代需1154次,高斯-塞德尔迭代需578次,最佳SOR迭代仅需61次。

二、块迭代法的一般构造与核心格式

块迭代法的核心思想:将系数矩阵 \(A\) 按结构分块,把每个子块当作“标量元素”,完全类比点迭代的分裂思想,构造分块形式的迭代格式。

2.1 矩阵的块D-L-U分解

\(A \in \mathbb{R}^{n \times n}\) 为大型稀疏矩阵,将其分块为 \(q \times q\) 的块矩阵:

\[A = \begin{pmatrix} A_{11} & A_{12} & \dots & A_{1q} \\ A_{21} & A_{22} & \dots & A_{2q} \\ \vdots & \vdots & & \vdots \\ A_{q1} & A_{q2} & \dots & A_{qq} \end{pmatrix} \]

其中主对角块 \(A_{ii} \in \mathbb{R}^{n_i \times n_i}\) 为非奇异矩阵,且 \(\sum_{i=1}^q n_i = n\)

类比点迭代的D-L-U分解,定义块形式的分解:

  1. 块对角矩阵:\(\boldsymbol{D} = \text{diag}(A_{11},A_{22},\dots,A_{qq})\)
  2. 严格块下三角矩阵:\(\boldsymbol{L} = \begin{pmatrix} 0 & & \\ -A_{21} & 0 & \\ \vdots & \ddots & \ddots \\ -A_{q1} & \dots & -A_{q,q-1} & 0 \end{pmatrix}\)
  3. 严格块上三角矩阵:\(\boldsymbol{U} = \begin{pmatrix} 0 & -A_{12} & \dots & -A_{1q} \\ & 0 & \dots & -A_{2q} \\ & & \ddots & \vdots \\ & & & 0 \end{pmatrix}\)

因此得到块形式的矩阵分裂:\(\boldsymbol{A = D - L - U}\),与点迭代的分解形式完全一致,仅将标量替换为矩阵块。

2.2 块雅可比迭代法(BJ)

(1)迭代构造

类比点雅可比迭代,选取分裂矩阵 \(M=D\)(块对角矩阵),则 \(A = M - N\),其中 \(N = L + U\)

代入迭代法通用格式 \(Mx^{(k+1)} = Nx^{(k)} + b\),得到块雅可比迭代的矩阵形式:

\[\boldsymbol{Dx^{(k+1)} = (L+U)x^{(k)} + b} \]

(2)分量迭代格式

按块展开,得到可直接计算的分量格式:

\[\boldsymbol{A_{ii} x_i^{(k+1)} = b_i - \sum_{\substack{j=1 \\ j \neq i}}^q A_{ij} x_j^{(k)}}, \quad i=1,2,\dots,q \tag{6.31} \]

其中 \(x = (x_1,x_2,\dots,x_q)^T\)\(b=(b_1,b_2,\dots,b_q)^T\) 为与矩阵分块对应的向量分块,\(x_i \in \mathbb{R}^{n_i}\)\(b_i \in \mathbb{R}^{n_i}\)

(3)计算逻辑与优势

块雅可比迭代每一步的核心操作:对每个 \(i\),求解一个低阶线性方程组 \(A_{ii} x_i^{(k+1)} = g_i\)\(g_i\) 为等式右端的已知项)。

  • 若主对角块 \(A_{ii}\) 为三对角、带状矩阵,可通过追赶法(Thomas算法)直接求解,无需迭代,计算效率极高;
  • 各子块的求解相互独立,天然适合并行计算,是大规模并行计算的核心迭代格式之一。

2.3 块超松弛迭代法(BSOR)

(1)迭代构造

类比点SOR迭代,选取带松弛因子的分裂矩阵:

\[\boldsymbol{M = \frac{1}{\omega}(D - \omega L)} \]

其中 \(\omega>0\) 为松弛因子,\(D-\omega L\) 为块下三角矩阵,主对角块为 \(A_{ii}\)(非奇异),因此 \(M\) 可逆。

代入迭代法通用格式,得到BSOR迭代的矩阵形式:

\[x^{(k+1)} = L_\omega x^{(k)} + f \]

其中:

  • 迭代矩阵:\(\boldsymbol{L_\omega = (D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]}\)
  • 常数项:\(\boldsymbol{f = \omega (D - \omega L)^{-1} b}\)

(2)分量迭代格式

按块展开,得到可直接计算的分量格式:

\[\boldsymbol{A_{ii} x_i^{(k+1)} = A_{ii} x_i^{(k)} + \omega \left( b_i - \sum_{j=1}^{i-1} A_{ij} x_j^{(k+1)} - \sum_{j=i}^q A_{ij} x_j^{(k)} \right)} \tag{6.32} \]

\[i=1,2,\dots,q, \quad k=0,1,2,\dots \]

(3)计算逻辑与松弛思想

BSOR迭代是块高斯-塞德尔迭代(BGS,\(\omega=1\))的推广,核心松弛逻辑:

  1. 先通过块高斯-塞德尔迭代计算辅助值 \(\tilde{x}_i^{(k+1)}\)\(A_{ii} \tilde{x}_i^{(k+1)} = b_i - \sum_{j=1}^{i-1} A_{ij} x_j^{(k+1)} - \sum_{j=i+1}^q A_{ij} x_j^{(k)}\)
  2. 对旧值 \(x_i^{(k)}\) 与辅助值 \(\tilde{x}_i^{(k+1)}\) 做加权平均:\(x_i^{(k+1)} = (1-\omega)x_i^{(k)} + \omega \tilde{x}_i^{(k+1)}\)
  3. 整理后即得到式(6.32)的迭代格式。

与块雅可比迭代一致,每一步迭代仅需求解 \(q\) 个低阶线性方程组,利用主对角块的带状结构可实现高效求解。

  • 实例验证:对泊松方程模型问题(\(h=0.05\)),块雅可比迭代需581次,块高斯-塞德尔迭代需292次,最佳BSOR迭代仅需52次,收敛速度优于点迭代。

三、块迭代法的收敛性理论与证明

块迭代法的收敛性判定与点迭代完全一致,核心是迭代矩阵的谱半径 \(\rho(L) < 1\),以下给出工程中最常用的收敛性定理与完整证明。

3.1 定理6.13:对称正定矩阵的BSOR收敛充分条件

定理内容

设线性方程组 \(Ax=b\) 满足:

  1. 系数矩阵 \(A\)对称正定矩阵,块分解为 \(A=D-L-U\)
  2. 松弛因子满足 \(\boldsymbol{0 < \omega < 2}\)

则解 \(Ax=b\) 的BSOR迭代法一定收敛

完整证明

要证明BSOR迭代收敛,只需证明迭代矩阵 \(L_\omega\) 的任意特征值 \(\lambda\) 都满足 \(|\lambda| < 1\),即可推出 \(\rho(L_\omega) < 1\)

步骤1:从特征值定义出发

\(\lambda\)\(L_\omega\) 的任意特征值,\(y\) 为对应的非零特征向量,即 \(L_\omega y = \lambda y\),代入 \(L_\omega\) 的定义得:

\[(D - \omega L)^{-1}\left[(1-\omega)D + \omega U\right]y = \lambda y \]

两边左乘 \((D - \omega L)\) 消去逆矩阵,得到核心等式:

\[\left[(1-\omega)D + \omega U\right]y = \lambda (D - \omega L)y \tag{*} \]

步骤2:利用对称正定矩阵的性质
  1. \(A\) 对称正定 → \(A=A^T\),结合 \(A=D-L-U\),得 \(\boldsymbol{U=L^T}\)(严格块下三角矩阵的转置为严格块上三角矩阵);
  2. \(A\) 对称正定 → 主对角块 \(A_{ii}\) 对称正定,因此块对角矩阵 \(D\) 对称正定,对任意非零向量 \(y\),有 \(\boldsymbol{(Dy,y) > 0}\),记 \(\sigma = (Dy,y)\)
  3. \(-(Ly,y) = \alpha + i\beta\)\(\alpha,\beta\) 为实数),由 \(U=L^T\) 得:

    \[(Uy,y) = (L^T y,y) = (y,Ly) = \overline{(Ly,y)} = -\alpha + i\beta \]

  4. \(A\) 的正定性:\((Ay,y) = (Dy,y) - (Ly,y) - (Uy,y) = \sigma + 2\alpha > 0\)
步骤3:推导特征值的模

对式(*)两边与 \(y\) 做欧氏内积,整理得:

\[\lambda = \frac{(1-\omega)(Dy,y) + \omega(Uy,y)}{(Dy,y) - \omega(Ly,y)} = \frac{\sigma(1-\omega) - \omega\alpha + i\omega\beta}{\sigma + \omega\alpha + i\omega\beta} \]

计算模的平方:

\[|\lambda|^2 = \frac{\left[\sigma(1-\omega) - \omega\alpha\right]^2 + (\omega\beta)^2}{(\sigma + \omega\alpha)^2 + (\omega\beta)^2} \]

要证明 \(|\lambda| < 1\),只需证明分子 < 分母,即:

\[\Delta = \left[\sigma(1-\omega) - \omega\alpha\right]^2 - (\sigma + \omega\alpha)^2 < 0 \]

利用平方差公式展开:

\[\Delta = -\omega \cdot \sigma \cdot (\sigma + 2\alpha) \cdot (2-\omega) \]

分析符号:

  • \(0<\omega<2\)\(\omega>0\)\(2-\omega>0\)
  • \(\sigma>0\)\(\sigma+2\alpha>0\)(正定性质);

因此 \(\Delta < 0\),即分子 < 分母,故 \(|\lambda|^2 < 1 \implies |\lambda| < 1\)

由于 \(\lambda\)\(L_\omega\) 的任意特征值,因此 \(\rho(L_\omega) < 1\),BSOR迭代收敛,定理得证。

3.2 定理6.14:T-矩阵的BSOR收敛性与最佳松弛因子

该定理是块迭代法最佳松弛因子的核心理论,针对工程中最常见的块三对角矩阵。

1. T-矩阵的定义

形如

\[A = \begin{pmatrix} D_1 & F_1 & & \\ E_2 & D_2 & F_2 & \\ & \ddots & \ddots & \ddots & \\ & & E_{q-1} & D_{q-1} & F_{q-1} \\ & & & E_q & D_q \end{pmatrix} \]

块三对角矩阵,若主对角块 \(D_i\)\(i=1,2,\dots,q\))均为对角矩阵,则称 \(A\) 为T-矩阵。

工程意义:泊松方程的五点差分矩阵,通过网格点的红黑排序(棋盘排序)后,可转化为T-矩阵,是偏微分方程数值解中最常见的矩阵形式之一。

2. 定理内容

\(A\) 为非奇异的T-矩阵,块对角矩阵 \(D=\text{diag}(D_1,D_2,\dots,D_q)\) 非奇异,块雅可比迭代矩阵 \(J=I-D^{-1}A\),若 \(\rho(J) < 1\)(块雅可比迭代收敛),则:

  1. 对任意 \(0<\omega<2\),有 \(\rho(L_\omega) < 1\),即BSOR迭代收敛;
  2. 最佳松弛因子为:

    \[\boldsymbol{\omega_{opt} = \frac{2}{1 + \sqrt{1 - [\rho(J)]^2}}} \]

  3. 迭代矩阵的谱半径满足分段表达式:

    \[\rho(L_\omega) = \begin{cases} \displaystyle \frac{1}{4}\left[ \omega\mu + \sqrt{\omega^2\mu^2 - 4(\omega-1)} \right]^2, & 0 < \omega < \omega_{opt} \\ \omega - 1, & \omega_{opt} \leq \omega < 2 \end{cases} \]

    其中 \(\mu = \rho(J)\),且 \(\rho(L_{\omega_{opt}}) = \omega_{opt} - 1 = \min_{0<\omega<2} \rho(L_\omega)\)

3. 核心推论

\(\omega=1\) 时,BSOR退化为块高斯-塞德尔迭代(BGS),此时:

\[\rho(L_1) = \mu^2 = [\rho(J)]^2 \]

因此块高斯-塞德尔迭代的渐近收敛速度为:

\[R(L_1) = -\ln \rho(L_1) = -2\ln \rho(J) = 2R(J) \]

块高斯-塞德尔迭代的收敛速度是块雅可比迭代的2倍,与点迭代的收敛速度关系完全一致。


四、块迭代法核心知识点总结表

迭代方法 迭代矩阵/核心格式 收敛充要条件 常用收敛充分条件 最佳松弛因子(T-矩阵) 收敛速度特性 核心适用场景
块雅可比迭代(BJ) 迭代矩阵 \(B=D^{-1}(L+U)\)
格式:\(A_{ii}x_i^{(k+1)}=b_i-\sum_{j≠i}A_{ij}x_j^{(k)}\)
\(\rho(B) < 1\) 1. \(A\) 对称正定;
2. \(A\) 严格对角占优/弱对角占优不可约
无(无松弛因子) 收敛速度 \(R(B)=-\ln\rho(B)\),BGS收敛速度是其2倍 大型稀疏块对角占优矩阵,并行计算场景
块高斯-塞德尔迭代(BGS) 迭代矩阵 \(L_1=(D-L)^{-1}U\)
格式:\(\omega=1\) 时的BSOR格式
\(\rho(L_1) < 1\) 1. \(A\) 对称正定;
2. \(A\) 严格对角占优/弱对角占优不可约
收敛速度是同条件块雅可比的2倍 串行计算场景,对称正定/对角占优矩阵
块SOR迭代(BSOR) 迭代矩阵 \(L_\omega=(D-\omega L)^{-1}[(1-\omega)D+\omega U]\)
格式:式(6.32)
\(\rho(L_\omega) < 1\) 1. \(A\) 对称正定 + \(0<\omega<2\)
2. T-矩阵 + \(\rho(J)<1\) + \(0<\omega<2\)
3. 严格对角占优 + \(0<\omega≤1\)
\(\omega_{opt}=\frac{2}{1+\sqrt{1-\rho(J)^2}}\) 取最佳松弛因子时,收敛速度比BGS高1个数量级,比点SOR更快 偏微分方程离散的块三对角矩阵,大规模工程计算

五、点迭代与块迭代的核心对比总结

对比维度 点迭代法(雅可比/GS/SOR) 块迭代法(BJ/BGS/BSOR)
处理对象 矩阵的单个元素 矩阵的子块(利用分块结构)
核心操作 标量的四则运算 低阶线性方程组的直接求解
收敛速度 较慢,依赖网格步长 更快,同条件下优于点迭代
并行性 雅可比可并行,GS/SOR串行性强 块雅可比天然并行,块SOR可实现块内并行
工程适配性 适合小规模、结构简单的矩阵 适合大型稀疏、分块结构明显的矩阵(如PDE离散、有限元)
收敛性判定 与块迭代完全一致,核心为谱半径<1 与点迭代理论体系完全兼容,可直接推广

posted on 2026-03-01 17:02  Indian_Mysore  阅读(1)  评论(0)    收藏  举报

导航