昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.2雅可比迭代法与高斯-塞德尔迭代法

雅可比迭代法与高斯-塞德尔迭代法 深度讲解与完整推导

作为求解大型稀疏线性方程组最基础、最常用的两种迭代法,雅可比(Jacobi)迭代与高斯-塞德尔(Gauss-Seidel, G-S)迭代是迭代法理论的核心应用。我将从矩阵分裂的底层逻辑出发,完整推导两种方法的迭代格式、迭代矩阵、分量计算公式,结合实例解析核心差异,最后进行结构化总结。


一、前置基础:系数矩阵的三部分拆分

两种迭代法的构造都基于系数矩阵的标准化拆分,这是所有推导的基础。

对于\(n\)阶线性方程组\(Ax=b\),其中系数矩阵\(A=(a_{ij}) \in \mathbb{R}^{n \times n}\)要求对角元\(a_{ii} \neq 0 \ (i=1,2,\dots,n)\)(保证对角矩阵可逆,是两种方法的使用前提)。

我们将\(A\)拆分为三个矩阵的和差形式:

\[A = D - L - U \]

其中三个矩阵的定义严格如下:

  1. 对角矩阵\(D\):仅保留\(A\)的对角元,其余元素为0

    \[D = \text{diag}(a_{11},a_{22},\dots,a_{nn}) = \begin{pmatrix} a_{11} & & & \\ & a_{22} & & \\ & & \ddots & \\ & & & a_{nn} \end{pmatrix} \]

  2. 严格下三角矩阵\(L\):仅保留\(A\)的严格下三角部分(\(i>j\))并取负,其余元素为0

    \[L = \begin{pmatrix} 0 & & & \\ -a_{21} & 0 & & \\ \vdots & \vdots & \ddots & \\ -a_{n1} & -a_{n2} & \dots & 0 \end{pmatrix} \]

  3. 严格上三角矩阵\(U\):仅保留\(A\)的严格上三角部分(\(i<j\))并取负,其余元素为0

    \[U = \begin{pmatrix} 0 & -a_{12} & \dots & -a_{1n} \\ & 0 & \dots & -a_{2n} \\ & & \ddots & \vdots \\ & & & 0 \end{pmatrix} \]

拆分的正确性验证

对任意位置\((i,j)\)的元素,验证\(A=D-L-U\)的一致性:

  • \(i=j\)(对角元):\(D_{ii}=a_{ii}\)\(L_{ii}=U_{ii}=0\),故\(D-L-U\)的对角元为\(a_{ii}\),与\(A\)一致;
  • \(i>j\)(严格下三角):\(D_{ij}=0\)\(L_{ij}=-a_{ij}\)\(U_{ij}=0\),故\(D-L-U\)的元素为\(0 - (-a_{ij}) - 0 = a_{ij}\),与\(A\)一致;
  • \(i<j\)(严格上三角):\(D_{ij}=0\)\(L_{ij}=0\)\(U_{ij}=-a_{ij}\),故\(D-L-U\)的元素为\(0 - 0 - (-a_{ij}) = a_{ij}\),与\(A\)一致。

二、雅可比迭代法(Jacobi Iteration)

雅可比迭代是最基础的定常迭代法,核心思想是全旧值更新:计算新迭代步的所有分量时,全部使用上一步的迭代结果,不使用当前步已算出的新值。

1. 迭代格式的构造(矩阵分裂法)

根据迭代法的通用构造逻辑\(A=M-N\),雅可比迭代选择分裂矩阵\(M=D\)\(A\)的对角部分)。
选择\(M=D\)的核心原因:

  • 对角矩阵天然可逆(满足\(a_{ii} \neq 0\));
  • 求解\(Mx=d\)的计算量极低,仅需对角元求倒数:\(x_i = d_i/a_{ii}\),完全符合分裂矩阵“易求解”的要求。

迭代矩阵与常数项推导

\(A=M-N\),可得剩余矩阵\(N\)

\[N = M - A = D - (D-L-U) = L+U \]

根据通用迭代格式\(x^{(k+1)} = M^{-1}N x^{(k)} + M^{-1}b\),代入\(M=D\)\(N=L+U\),得到:

  1. 雅可比迭代矩阵(记为\(J\)):

    \[J = D^{-1}N = D^{-1}(L+U) \]

    等价形式:\(J = I - D^{-1}A\)(推导:\(I - D^{-1}A = D^{-1}D - D^{-1}A = D^{-1}(D-A) = D^{-1}(L+U)\))。
  2. 常数项

    \[f = D^{-1}b \]

因此,雅可比迭代的矩阵形式为:

\[\begin{cases} x^{(0)} \quad (\text{初始向量}) \\ x^{(k+1)} = J x^{(k)} + f = D^{-1}(L+U)x^{(k)} + D^{-1}b, \quad k=0,1,2,\dots \end{cases} \tag{6.14} \]

2. 分量计算公式推导

将矩阵形式\(D x^{(k+1)} = (L+U)x^{(k)} + b\)按行展开,得到每个分量的计算公式。

  • 等式左侧\(D x^{(k+1)}\)的第\(i\)个分量:\(a_{ii} x_i^{(k+1)}\)
  • 等式右侧\((L+U)x^{(k)}\)的第\(i\)个分量:

    \[(Lx^{(k)})_i + (Ux^{(k)})_i = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} \]

因此,第\(i\)个分量的等式为:

\[a_{ii} x_i^{(k+1)} = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} + b_i \]

两边除以\(a_{ii}\),得到雅可比迭代的分量计算公式

\[\begin{cases} x^{(0)} = (x_1^{(0)},x_2^{(0)},\dots,x_n^{(0)})^T \quad (\text{初始向量}) \\ x_i^{(k+1)} = \frac{1}{a_{ii}} \left( b_i - \sum_{\substack{j=1 \\ j \neq i}}^{n} a_{ij} x_j^{(k)} \right), \quad i=1,2,\dots,n; \ k=0,1,2,\dots \end{cases} \tag{6.15} \]

3. 雅可比迭代的核心特点

  1. 全旧值更新:计算\(x^{(k+1)}\)的所有分量时,全部使用上一步\(x^{(k)}\)的结果,分量之间无计算依赖,天然适合并行计算
  2. 存储需求:需要两套独立数组,分别存储上一步的旧值\(x^{(k)}\)和当前步的新值\(x^{(k+1)}\),无法覆盖存储;
  3. 计算特性:公式简单,每迭代一次仅需一次矩阵-向量乘法,原始矩阵\(A\)全程不变,无需修改;
  4. 收敛性:收敛速度较慢,仅在满足特定条件(如严格对角占优)时收敛。

三、高斯-塞德尔迭代法(Gauss-Seidel Iteration)

高斯-塞德尔迭代是雅可比迭代的改进版,核心思想是新值优先、边算边用:计算第\(i\)个分量时,直接使用当前步已经算出的前\(i-1\)个分量的新值,仅对未计算的后\(n-i\)个分量使用旧值,修正更及时,通常收敛速度更快。

1. 迭代格式的构造(矩阵分裂法)

高斯-塞德尔迭代选择分裂矩阵\(M=D-L\)\(A\)的对角部分+严格下三角部分,即下三角矩阵)。
选择\(M=D-L\)的核心原因:

  • 下三角矩阵可逆(对角元\(a_{ii} \neq 0\),行列式为对角元乘积,非零);
  • 求解\(Mx=d\)仅需向前代入法(前代法),计算量极低,无需矩阵求逆,符合分裂矩阵的要求。

迭代矩阵与常数项推导

\(A=M-N\),可得剩余矩阵\(N\)

\[N = M - A = (D-L) - (D-L-U) = U \]

根据通用迭代格式,代入\(M=D-L\)\(N=U\),得到:

  1. 高斯-塞德尔迭代矩阵(记为\(G\)):

    \[G = (D-L)^{-1}N = (D-L)^{-1}U \]

    等价形式:\(G = I - (D-L)^{-1}A\)(推导:\(I - (D-L)^{-1}A = (D-L)^{-1}(D-L) - (D-L)^{-1}A = (D-L)^{-1}(D-L-A) = (D-L)^{-1}U\))。
  2. 常数项

    \[f = (D-L)^{-1}b \]

因此,高斯-塞德尔迭代的矩阵形式为:

\[\begin{cases} x^{(0)} \quad (\text{初始向量}) \\ x^{(k+1)} = G x^{(k)} + f = (D-L)^{-1}U x^{(k)} + (D-L)^{-1}b, \quad k=0,1,2,\dots \end{cases} \tag{6.16} \]

2. 分量计算公式推导

将矩阵形式\((D-L)x^{(k+1)} = Ux^{(k)} + b\)展开,移项得:

\[D x^{(k+1)} = L x^{(k+1)} + U x^{(k)} + b \]

按行展开分量形式:

  • 等式左侧\(D x^{(k+1)}\)的第\(i\)个分量:\(a_{ii} x_i^{(k+1)}\)
  • 等式右侧\(L x^{(k+1)}\)的第\(i\)个分量:\(-\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)}\)(使用当前步已算出的新值\(x_j^{(k+1)}\));
  • 等式右侧\(U x^{(k)}\)的第\(i\)个分量:\(-\sum_{j=i+1}^{n}a_{ij}x_j^{(k)}\)(使用上一步的旧值\(x_j^{(k)}\))。

因此,第\(i\)个分量的等式为:

\[a_{ii} x_i^{(k+1)} = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} + b_i \]

两边除以\(a_{ii}\),得到高斯-塞德尔迭代的分量计算公式

\[\begin{cases} x^{(0)} = (x_1^{(0)},x_2^{(0)},\dots,x_n^{(0)})^T \quad (\text{初始向量}) \\ x_i^{(k+1)} = \frac{1}{a_{ii}} \left( b_i - \sum_{j=1}^{i-1} a_{ij} x_j^{(k+1)} - \sum_{j=i+1}^{n} a_{ij} x_j^{(k)} \right), \quad i=1,2,\dots,n; \ k=0,1,2,\dots \end{cases} \]

增量形式(工程常用)

工程编程中常使用增量形式,直观体现每一步的修正量:

\[\begin{cases} x_i^{(k+1)} = x_i^{(k)} + \Delta x_i \\ \Delta x_i = \frac{1}{a_{ii}} \left( b_i - \sum_{j=1}^{i-1} a_{ij} x_j^{(k+1)} - \sum_{j=1}^{n} a_{ij} x_j^{(k)} \right) \end{cases} \tag{6.17} \]

3. 高斯-塞德尔迭代的算法实现

算法6.1给出了高斯-塞德尔迭代的标准实现流程,核心是覆盖存储:算出来的新值直接覆盖旧值,无需额外数组。

算法6.1 高斯-塞德尔迭代法
输入:系数矩阵A∈R^{n×n},右端项b,初始向量x,最大迭代次数N0
输出:迭代解x
1. 初始化:x_i ← 0.0 (i=1,2,…,n) (或初始向量x^{(0)})
2. 迭代循环:对于k=1,2,…,N0
    3. 分量更新:对于i=1,2,…,n
        x_i ← (b_i - Σ_{j=1}^{i-1} a_{ij}x_j - Σ_{j=i+1}^n a_{ij}x_j) / a_{ii}
    4. 精度判断:若||x^{(k)} - x^{(k-1)}|| < 预设精度,跳出循环
5. 返回迭代解x

算法说明:迭代一次的运算量至多与矩阵\(A\)的非零元素个数一致,完美适配大型稀疏矩阵,零元素无需参与计算,内存和运算量优势显著。

4. 高斯-塞德尔迭代的核心特点

  1. 新值优先更新:计算\(x_i^{(k+1)}\)时,直接使用当前步已算出的\(x_1^{(k+1)},\dots,x_{i-1}^{(k+1)}\),修正更及时,通常收敛速度快于雅可比迭代;
  2. 存储需求:仅需一套数组,新值直接覆盖旧值,内存占用仅为雅可比迭代的一半;
  3. 计算特性:每迭代一次仅需一次矩阵-向量乘法,但分量之间存在计算依赖(\(x_i\)依赖\(x_1\)\(x_{i-1}\)),不适合并行计算,串行场景优势明显;
  4. 收敛性:收敛条件与雅可比迭代不完全等价,存在雅可比收敛但高斯-塞德尔发散的情况,反之亦然;在严格对角占优、对称正定等条件下,两种方法均收敛,且高斯-塞德尔收敛更快。

四、实例解析:两种方法的收敛速度对比

以例6.6的线性方程组为例,直观对比两种方法的计算过程与收敛效率。

例题方程组

\[\begin{cases} 8x_1 - 3x_2 + 2x_3 = 20 \\ 4x_1 + 11x_2 - x_3 = 33 \\ 6x_1 + 3x_2 + 12x_3 = 36 \end{cases} \]

精确解\(x^* = (3, 2, 1)^T\),初始向量取\(x^{(0)}=(0,0,0)^T\),精度要求\(\|x^* - x^{(k)}\|_\infty < 10^{-6}\)

1. 雅可比迭代公式与计算

\[\begin{cases} x_1^{(k+1)} = \frac{1}{8}(3x_2^{(k)} - 2x_3^{(k)} + 20) \\ x_2^{(k+1)} = \frac{1}{11}(-4x_1^{(k)} + x_3^{(k)} + 33) \\ x_3^{(k+1)} = \frac{1}{12}(-6x_1^{(k)} - 3x_2^{(k)} + 36) \end{cases} \]

  • 第1步迭代结果:\(x^{(1)}=(2.5, 3, 3)^T\)
  • 迭代至第14次,满足精度要求:\(x^{(14)}=(3.000001117, 2.000000623, 0.999998890)^T\)

2. 高斯-塞德尔迭代公式与计算

\[\begin{cases} x_1^{(k+1)} = \frac{1}{8}(3x_2^{(k)} - 2x_3^{(k)} + 20) \\ x_2^{(k+1)} = \frac{1}{11}(-4x_1^{(k+1)} + x_3^{(k)} + 33) \\ x_3^{(k+1)} = \frac{1}{12}(-6x_1^{(k+1)} - 3x_2^{(k+1)} + 36) \end{cases} \]

  • 第1步迭代结果:\(x^{(1)}=(2.5, 2.0909, 1.2273)^T\),已显著更接近精确解
  • 迭代至第7次,满足精度要求:\(x^{(7)}=(3.000002012, 1.999998701, 0.999999318)^T\)

实例结论

在该算例中,高斯-塞德尔迭代的收敛速度约为雅可比迭代的2倍,达到相同精度所需迭代次数减少一半,核心原因是新值的及时利用加速了误差修正。


五、知识点结构化总结表

对比维度 雅可比迭代法(Jacobi) 高斯-塞德尔迭代法(Gauss-Seidel)
核心思想 全旧值更新,所有分量均使用上一步迭代结果 新值优先更新,已算出的分量直接使用当前步新值
分裂矩阵\(M\) \(M=D\)(对角矩阵) \(M=D-L\)(下三角矩阵)
迭代矩阵 \(J = D^{-1}(L+U) = I - D^{-1}A\) \(G = (D-L)^{-1}U = I - (D-L)^{-1}A\)
分量计算公式核心 \(x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j≠i}a_{ij}x_j^{(k)}\right)\) \(x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^n a_{ij}x_j^{(k)}\right)\)
存储需求 2套数组(旧值+新值),无法覆盖 1套数组,新值直接覆盖旧值,内存占用低
并行性 分量计算无依赖,天然适合并行计算 分量存在串行依赖,不适合并行计算
收敛速度 较慢,通常需要更多迭代次数 较快(收敛条件满足时),迭代次数约为雅可比的1/2
计算量/迭代步 每步1次矩阵-向量乘法,运算量与非零元个数成正比 每步1次矩阵-向量乘法,运算量与非零元个数成正比
适用场景 并行计算平台、大规模分布式求解 串行计算场景、内存受限的工程计算
收敛性前提 充要条件:谱半径\(\rho(J) < 1\)
充分条件:\(A\)严格对角占优/对称正定
充要条件:谱半径\(\rho(G) < 1\)
充分条件:\(A\)严格对角占优/对称正定

雅可比与高斯-塞德尔迭代法收敛性 深度讲解与完整推导

作为迭代法工程应用的核心判据,两种迭代法的收敛性分析直接决定了算法的适用场景与可靠性。我将从通用收敛准则出发,完整推导特殊矩阵的收敛定理,结合实例验证两种方法的收敛性差异,最终形成体系化的收敛性判断框架。


一、迭代法收敛的通用充要条件(定理6.7)

定理内容

设线性方程组\(Ax=b\),其中\(A=D-L-U\)为非奇异矩阵,且对角矩阵\(D\)非奇异(即\(a_{ii} \neq 0, i=1,2,\dots,n\)),则:

  1. 雅可比迭代法收敛的充要条件:迭代矩阵\(J=D^{-1}(L+U)\)的谱半径\(\rho(J) < 1\)
  2. 高斯-塞德尔迭代法收敛的充要条件:迭代矩阵\(G=(D-L)^{-1}U\)的谱半径\(\rho(G) < 1\)

推导与说明

该定理是迭代法基本定理(定理6.5)的直接推论:

  • 单步定常迭代\(x^{(k+1)}=Bx^{(k)}+f\)对任意初始向量收敛的充要条件,是迭代矩阵\(B\)的谱半径\(\rho(B) < 1\)
  • 雅可比迭代的迭代矩阵为\(J=D^{-1}(L+U)\),高斯-塞德尔迭代的迭代矩阵为\(G=(D-L)^{-1}U\),直接代入基本定理即可得到上述结论。

补充:收敛的充分条件

由谱半径的基本性质\(\rho(B) \leq \|B\|\)(矩阵的谱半径不超过其任意一种从属范数),可直接得到收敛的充分非必要条件

  • 若雅可比迭代矩阵的某从属范数\(\|J\| < 1\),则雅可比迭代收敛;
  • 若高斯-塞德尔迭代矩阵的某从属范数\(\|G\| < 1\),则高斯-塞德尔迭代收敛。

该条件的优势是无需计算特征值,仅通过范数计算即可快速判断收敛性,工程中常用∞-范数、1-范数快速校验。


二、对角占优矩阵的收敛性定理(定理6.8)

工程中大量线性方程组的系数矩阵具有对角占优特性,该定理给出了这类矩阵的收敛性保证,是工程中最常用的收敛判据。

前置定义

  1. 严格对角占优矩阵:对\(n\)阶矩阵\(A\),若对每一行\(i=1,2,\dots,n\),都满足

    \[|a_{ii}| > \sum_{\substack{j=1 \\ j \neq i}}^n |a_{ij}| \]

    即对角元的绝对值严格大于该行其余所有元素绝对值的和。
  2. 不可约矩阵:矩阵不能通过行、列的同步置换,变为分块上三角矩阵,通俗来说,方程组的变量无法拆分为两组互不关联的子系统。
  3. 弱对角占优矩阵:对所有行满足\(|a_{ii}| \geq \sum_{j \neq i} |a_{ij}|\),且至少存在一行严格大于。

定理6.8 内容

设线性方程组\(Ax=b\),满足以下任一条件时,雅可比迭代法与高斯-塞德尔迭代法均收敛:

  1. \(A\)严格对角占优矩阵
  2. \(A\)不可约弱对角占优矩阵

完整证明(以高斯-塞德尔迭代为例)

我们仅需证明:当\(A\)为严格对角占优矩阵时,高斯-塞德尔迭代矩阵\(G\)的谱半径\(\rho(G) < 1\),雅可比迭代的证明思路完全一致。

步骤1:特征方程等价变形

高斯-塞德尔迭代矩阵为\(G=(D-L)^{-1}U\),其特征方程为\(\det(\lambda I - G) = 0\)。代入\(G\)的表达式做变形:

\[\begin{align*} \det(\lambda I - G) &= \det\left(\lambda I - (D-L)^{-1}U\right) \\ &= \det\left( (D-L)^{-1} \cdot \left[ \lambda(D-L) - U \right] \right) \\ &= \det\left( (D-L)^{-1} \right) \cdot \det\left( \lambda(D-L) - U \right) \end{align*} \]

由于\(D\)非奇异(对角元非零),\(D-L\)是下三角矩阵,对角元为\(a_{ii} \neq 0\),因此\(\det((D-L)^{-1}) \neq 0\)

因此,特征方程\(\det(\lambda I - G)=0\)等价于

\[\det\left( \lambda(D-L) - U \right) = 0 \]

步骤2:构造矩阵并分析对角占优性

记矩阵\(C = \lambda(D-L) - U\),写出\(C\)的元素结构:

  • 对角元:\(C_{ii} = \lambda a_{ii}\)
  • 严格下三角(\(i>j\)):\(C_{ij} = \lambda a_{ij}\)
  • 严格上三角(\(i<j\)):\(C_{ij} = a_{ij}\)

我们采用反证法:假设存在\(G\)的一个特征值\(\lambda\)满足\(|\lambda| \geq 1\),我们将证明此时\(\det(C) \neq 0\),与特征方程矛盾,因此所有特征值必须满足\(|\lambda| < 1\)

\(|\lambda| \geq 1\)时,分析\(C\)的第\(i\)行对角占优性:

  • 对角元绝对值:\(|C_{ii}| = |\lambda a_{ii}| = |\lambda| \cdot |a_{ii}|\)
  • 非对角元绝对值和:

    \[\sum_{\substack{j=1 \\ j \neq i}}^n |C_{ij}| = \sum_{j=1}^{i-1} |\lambda a_{ij}| + \sum_{j=i+1}^n |a_{ij}| = |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| \]

由于\(A\)是严格对角占优矩阵,满足:

\[|a_{ii}| > \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| \]

两边同时乘以\(|\lambda| \geq 1\),得:

\[|\lambda| \cdot |a_{ii}| > |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + |\lambda| \sum_{j=i+1}^n |a_{ij}| \]

由于\(|\lambda| \geq 1\),因此\(|\lambda| \sum_{j=i+1}^n |a_{ij}| \geq \sum_{j=i+1}^n |a_{ij}|\),代入上式得:

\[|\lambda| \cdot |a_{ii}| > |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| = \sum_{j \neq i} |C_{ij}| \]

\(|C_{ii}| > \sum_{j \neq i} |C_{ij}|\),因此矩阵\(C\)是严格对角占优矩阵

步骤3:导出矛盾,完成证明

根据严格对角占优矩阵的核心性质:严格对角占优矩阵一定是非奇异矩阵,即\(\det(C) \neq 0\),这与特征方程\(\det(C)=0\)矛盾。

因此假设不成立,\(G\)的所有特征值都满足\(|\lambda| < 1\),即\(\rho(G) < 1\),高斯-塞德尔迭代收敛。


三、对称正定矩阵的收敛性定理(定理6.9)

有限元、结构力学等工程问题中,系数矩阵大多为对称正定矩阵,该定理给出了这类矩阵的收敛性保证,是工程仿真中的核心判据。

定理6.9 内容

设矩阵\(A\)对称,且对角元\(a_{ii} > 0 \ (i=1,2,\dots,n)\),则:

  1. 雅可比迭代法收敛的充要条件\(A\)\(2D-A\)均为正定矩阵;
  2. 高斯-塞德尔迭代法收敛的充分条件\(A\)为对称正定矩阵。

核心解读

  1. 高斯-塞德尔迭代的收敛性条件更宽松:只要\(A\)对称正定,无需额外条件,高斯-塞德尔迭代一定收敛,这是极强的工程实用结论;
  2. 雅可比迭代的收敛性条件更严格:仅\(A\)正定不足以保证雅可比收敛,还需要\(2D-A\)也正定,否则可能出现“\(A\)正定但雅可比迭代发散”的情况;
  3. 两种迭代的收敛性不存在绝对的包含关系:存在雅可比收敛但高斯-塞德尔发散的矩阵,也存在高斯-塞德尔收敛但雅可比发散的矩阵。

四、实例完整推导(例6.7)

题目

线性方程组\(Ax=b\)的系数矩阵为:

\[A = \begin{pmatrix} 1 & a & a \\ a & 1 & a \\ a & a & 1 \end{pmatrix} \]

证明:

  1. \(-\frac{1}{2} < a < 1\)时,高斯-塞德尔迭代法收敛;
  2. 雅可比迭代法仅当\(-\frac{1}{2} < a < \frac{1}{2}\)时收敛。

1. 高斯-塞德尔迭代收敛性证明

根据定理6.9,对称正定矩阵的高斯-塞德尔迭代一定收敛,因此我们只需证明:当\(-\frac{1}{2} < a < 1\)时,\(A\)为对称正定矩阵。

对称矩阵正定的充要条件是:所有顺序主子式均大于0。我们逐阶计算\(A\)的顺序主子式:

  1. 一阶顺序主子式:\(D_1 = \det\begin{pmatrix}1\end{pmatrix} = 1 > 0\),对任意\(a\)恒成立;

  2. 二阶顺序主子式:

    \[D_2 = \det\begin{pmatrix}1 & a \\ a & 1\end{pmatrix} = 1 - a^2 > 0 \]

    解得\(|a| < 1\),即\(-1 < a < 1\)

  3. 三阶顺序主子式(矩阵行列式):

    \[\begin{align*} D_3 = \det(A) &= 1 \cdot \det\begin{pmatrix}1 & a \\ a & 1\end{pmatrix} - a \cdot \det\begin{pmatrix}a & a \\ a & 1\end{pmatrix} + a \cdot \det\begin{pmatrix}a & 1 \\ a & a\end{pmatrix} \\ &= (1-a^2) - a(a - a^2) + a(a^2 - a) \\ &= 1 - 3a^2 + 2a^3 \end{align*} \]

    因式分解得:\(D_3 = (1-a)^2(2a+1)\)

    由于\((1-a)^2 \geq 0\),当\(a \neq 1\)\((1-a)^2 > 0\),因此\(D_3 > 0\)等价于\(2a+1 > 0\),即\(a > -\frac{1}{2}\)

综上,当\(-\frac{1}{2} < a < 1\)时,\(A\)的所有顺序主子式均大于0,\(A\)为对称正定矩阵,根据定理6.9,高斯-塞德尔迭代法收敛。


2. 雅可比迭代收敛性证明

根据定理6.7,雅可比迭代收敛的充要条件是迭代矩阵\(J\)的谱半径\(\rho(J) < 1\),我们分步推导:

步骤1:构造雅可比迭代矩阵

\(A\)拆分为\(A=D-L-U\)

  • 对角矩阵\(D = \text{diag}(1,1,1)\),因此\(D^{-1}=I\)
  • 严格下三角矩阵\(L = \begin{pmatrix}0 & 0 & 0 \\ -a & 0 & 0 \\ -a & -a & 0\end{pmatrix}\)
  • 严格上三角矩阵\(U = \begin{pmatrix}0 & -a & -a \\ 0 & 0 & -a \\ 0 & 0 & 0\end{pmatrix}\)

因此雅可比迭代矩阵:

\[J = D^{-1}(L+U) = L+U = \begin{pmatrix}0 & -a & -a \\ -a & 0 & -a \\ -a & -a & 0\end{pmatrix} \]

步骤2:求解特征值与谱半径

解特征方程\(\det(\lambda I - J) = 0\)

\[\lambda I - J = \begin{pmatrix}\lambda & a & a \\ a & \lambda & a \\ a & a & \lambda\end{pmatrix} \]

计算行列式:

\[\det(\lambda I - J) = \lambda^3 - 3\lambda a^2 + 2a^3 \]

因式分解得:\(\det(\lambda I - J) = (\lambda - a)^2(\lambda + 2a) = 0\)

因此\(J\)的特征值为\(\lambda_1=\lambda_2=a\)\(\lambda_3=-2a\),谱半径为:

\[\rho(J) = \max\left\{ |a|, |-2a| \right\} = |2a| \]

步骤3:收敛性判断

雅可比迭代收敛的充要条件是\(\rho(J) < 1\),即\(|2a| < 1\),解得\(|a| < \frac{1}{2}\),即\(-\frac{1}{2} < a < \frac{1}{2}\)


实例结论

\(a \in (\frac{1}{2}, 1)\)时,\(A\)对称正定,高斯-塞德尔迭代收敛,但雅可比迭代的谱半径\(\rho(J)=|2a|>1\),雅可比迭代发散,完美验证了定理6.9的结论。


五、收敛性判据结构化总结表

判据类型 雅可比迭代法 高斯-塞德尔迭代法 条件类型 工程适用场景
通用充要条件 迭代矩阵谱半径\(\rho(J) < 1\),其中\(J=D^{-1}(L+U)\) 迭代矩阵谱半径\(\rho(G) < 1\),其中\(G=(D-L)^{-1}U\) 充要条件 理论分析、低阶矩阵收敛性判断
通用充分条件 迭代矩阵的任意从属范数\(|J| < 1\)(如∞-范数、1-范数) 迭代矩阵的任意从属范数\(|G| < 1\)(如∞-范数、1-范数) 充分非必要 高阶矩阵快速收敛性校验
严格对角占优矩阵 收敛 收敛 充分条件 偏微分方程离散、电路仿真方程组
不可约弱对角占优矩阵 收敛 收敛 充分条件 大规模网络、结构力学方程组
对称正定矩阵 收敛充要条件:\(A\)\(2D-A\)均正定 收敛充分条件:\(A\)对称正定 雅可比:充要;高斯-塞德尔:充分 有限元分析、优化问题、最小二乘求解
收敛速度对比 较慢,通常需要更多迭代次数 较快(收敛条件满足时),迭代次数约为雅可比的1/2 - 串行计算优先选高斯-塞德尔,并行计算优先选雅可比

posted on 2026-03-01 11:32  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航