夫君子之行，静以修身，俭以养德；非澹泊无以明志，非宁静无以致远。夫学须静也，才须学也；非学无以广才，非志无以成学。怠慢则不能励精，险躁则不能冶性。年与时驰，意与岁去，遂成枯落，多不接世。悲守穷庐，将复何及！

6.2雅可比迭代法与高斯-塞德尔迭代法

雅可比迭代法与高斯-塞德尔迭代法深度讲解与完整推导

作为求解大型稀疏线性方程组最基础、最常用的两种迭代法，雅可比（Jacobi）迭代与高斯-塞德尔（Gauss-Seidel, G-S）迭代是迭代法理论的核心应用。我将从矩阵分裂的底层逻辑出发，完整推导两种方法的迭代格式、迭代矩阵、分量计算公式，结合实例解析核心差异，最后进行结构化总结。

一、前置基础：系数矩阵的三部分拆分

两种迭代法的构造都基于系数矩阵的标准化拆分，这是所有推导的基础。

对于\(n\)阶线性方程组\(Ax=b\)，其中系数矩阵\(A=(a_{ij}) \in \mathbb{R}^{n \times n}\)，要求对角元\(a_{ii} \neq 0 \ (i=1,2,\dots,n)\)（保证对角矩阵可逆，是两种方法的使用前提）。

我们将\(A\)拆分为三个矩阵的和差形式：

\[A = D - L - U \]

其中三个矩阵的定义严格如下：

对角矩阵\(D\)：仅保留\(A\)的对角元，其余元素为0
\[D = \text{diag}(a_{11},a_{22},\dots,a_{nn}) = \begin{pmatrix} a_{11} & & & \\ & a_{22} & & \\ & & \ddots & \\ & & & a_{nn} \end{pmatrix} \]
严格下三角矩阵\(L\)：仅保留\(A\)的严格下三角部分（\(i>j\)）并取负，其余元素为0
\[L = \begin{pmatrix} 0 & & & \\ -a_{21} & 0 & & \\ \vdots & \vdots & \ddots & \\ -a_{n1} & -a_{n2} & \dots & 0 \end{pmatrix} \]
严格上三角矩阵\(U\)：仅保留\(A\)的严格上三角部分（\(i<j\)）并取负，其余元素为0
\[U = \begin{pmatrix} 0 & -a_{12} & \dots & -a_{1n} \\ & 0 & \dots & -a_{2n} \\ & & \ddots & \vdots \\ & & & 0 \end{pmatrix} \]

拆分的正确性验证

对任意位置\((i,j)\)的元素，验证\(A=D-L-U\)的一致性：

当\(i=j\)（对角元）：\(D_{ii}=a_{ii}\)，\(L_{ii}=U_{ii}=0\)，故\(D-L-U\)的对角元为\(a_{ii}\)，与\(A\)一致；
当\(i>j\)（严格下三角）：\(D_{ij}=0\)，\(L_{ij}=-a_{ij}\)，\(U_{ij}=0\)，故\(D-L-U\)的元素为\(0 - (-a_{ij}) - 0 = a_{ij}\)，与\(A\)一致；
当\(i<j\)（严格上三角）：\(D_{ij}=0\)，\(L_{ij}=0\)，\(U_{ij}=-a_{ij}\)，故\(D-L-U\)的元素为\(0 - 0 - (-a_{ij}) = a_{ij}\)，与\(A\)一致。

二、雅可比迭代法（Jacobi Iteration）

雅可比迭代是最基础的定常迭代法，核心思想是全旧值更新：计算新迭代步的所有分量时，全部使用上一步的迭代结果，不使用当前步已算出的新值。

1. 迭代格式的构造（矩阵分裂法）

根据迭代法的通用构造逻辑\(A=M-N\)，雅可比迭代选择分裂矩阵\(M=D\)（\(A\)的对角部分）。
选择\(M=D\)的核心原因：

对角矩阵天然可逆（满足\(a_{ii} \neq 0\)）；
求解\(Mx=d\)的计算量极低，仅需对角元求倒数：\(x_i = d_i/a_{ii}\)，完全符合分裂矩阵“易求解”的要求。

迭代矩阵与常数项推导

由\(A=M-N\)，可得剩余矩阵\(N\)：

\[N = M - A = D - (D-L-U) = L+U \]

根据通用迭代格式\(x^{(k+1)} = M^{-1}N x^{(k)} + M^{-1}b\)，代入\(M=D\)、\(N=L+U\)，得到：

雅可比迭代矩阵（记为\(J\)）：
\[J = D^{-1}N = D^{-1}(L+U) \]
等价形式：\(J = I - D^{-1}A\)（推导：\(I - D^{-1}A = D^{-1}D - D^{-1}A = D^{-1}(D-A) = D^{-1}(L+U)\)）。
常数项：
\[f = D^{-1}b \]

因此，雅可比迭代的矩阵形式为：

\[\begin{cases} x^{(0)} \quad (\text{初始向量}) \\ x^{(k+1)} = J x^{(k)} + f = D^{-1}(L+U)x^{(k)} + D^{-1}b, \quad k=0,1,2,\dots \end{cases} \tag{6.14} \]

2. 分量计算公式推导

将矩阵形式\(D x^{(k+1)} = (L+U)x^{(k)} + b\)按行展开，得到每个分量的计算公式。

等式左侧\(D x^{(k+1)}\)的第\(i\)个分量：\(a_{ii} x_i^{(k+1)}\)；
等式右侧\((L+U)x^{(k)}\)的第\(i\)个分量：
\[(Lx^{(k)})_i + (Ux^{(k)})_i = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} \]

因此，第\(i\)个分量的等式为：

\[a_{ii} x_i^{(k+1)} = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} + b_i \]

两边除以\(a_{ii}\)，得到雅可比迭代的分量计算公式：

\[\begin{cases} x^{(0)} = (x_1^{(0)},x_2^{(0)},\dots,x_n^{(0)})^T \quad (\text{初始向量}) \\ x_i^{(k+1)} = \frac{1}{a_{ii}} \left( b_i - \sum_{\substack{j=1 \\ j \neq i}}^{n} a_{ij} x_j^{(k)} \right), \quad i=1,2,\dots,n; \ k=0,1,2,\dots \end{cases} \tag{6.15} \]

3. 雅可比迭代的核心特点

全旧值更新：计算\(x^{(k+1)}\)的所有分量时，全部使用上一步\(x^{(k)}\)的结果，分量之间无计算依赖，天然适合并行计算；
存储需求：需要两套独立数组，分别存储上一步的旧值\(x^{(k)}\)和当前步的新值\(x^{(k+1)}\)，无法覆盖存储；
计算特性：公式简单，每迭代一次仅需一次矩阵-向量乘法，原始矩阵\(A\)全程不变，无需修改；
收敛性：收敛速度较慢，仅在满足特定条件（如严格对角占优）时收敛。

三、高斯-塞德尔迭代法（Gauss-Seidel Iteration）

高斯-塞德尔迭代是雅可比迭代的改进版，核心思想是新值优先、边算边用：计算第\(i\)个分量时，直接使用当前步已经算出的前\(i-1\)个分量的新值，仅对未计算的后\(n-i\)个分量使用旧值，修正更及时，通常收敛速度更快。

1. 迭代格式的构造（矩阵分裂法）

高斯-塞德尔迭代选择分裂矩阵\(M=D-L\)（\(A\)的对角部分+严格下三角部分，即下三角矩阵）。
选择\(M=D-L\)的核心原因：

下三角矩阵可逆（对角元\(a_{ii} \neq 0\)，行列式为对角元乘积，非零）；
求解\(Mx=d\)仅需向前代入法（前代法），计算量极低，无需矩阵求逆，符合分裂矩阵的要求。

迭代矩阵与常数项推导

由\(A=M-N\)，可得剩余矩阵\(N\)：

\[N = M - A = (D-L) - (D-L-U) = U \]

根据通用迭代格式，代入\(M=D-L\)、\(N=U\)，得到：

高斯-塞德尔迭代矩阵（记为\(G\)）：
\[G = (D-L)^{-1}N = (D-L)^{-1}U \]
等价形式：\(G = I - (D-L)^{-1}A\)（推导：\(I - (D-L)^{-1}A = (D-L)^{-1}(D-L) - (D-L)^{-1}A = (D-L)^{-1}(D-L-A) = (D-L)^{-1}U\)）。
常数项：
\[f = (D-L)^{-1}b \]

因此，高斯-塞德尔迭代的矩阵形式为：

\[\begin{cases} x^{(0)} \quad (\text{初始向量}) \\ x^{(k+1)} = G x^{(k)} + f = (D-L)^{-1}U x^{(k)} + (D-L)^{-1}b, \quad k=0,1,2,\dots \end{cases} \tag{6.16} \]

2. 分量计算公式推导

将矩阵形式\((D-L)x^{(k+1)} = Ux^{(k)} + b\)展开，移项得：

\[D x^{(k+1)} = L x^{(k+1)} + U x^{(k)} + b \]

按行展开分量形式：

等式左侧\(D x^{(k+1)}\)的第\(i\)个分量：\(a_{ii} x_i^{(k+1)}\)；
等式右侧\(L x^{(k+1)}\)的第\(i\)个分量：\(-\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)}\)（使用当前步已算出的新值\(x_j^{(k+1)}\)）；
等式右侧\(U x^{(k)}\)的第\(i\)个分量：\(-\sum_{j=i+1}^{n}a_{ij}x_j^{(k)}\)（使用上一步的旧值\(x_j^{(k)}\)）。

因此，第\(i\)个分量的等式为：

\[a_{ii} x_i^{(k+1)} = -\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^{n}a_{ij}x_j^{(k)} + b_i \]

两边除以\(a_{ii}\)，得到高斯-塞德尔迭代的分量计算公式：

\[\begin{cases} x^{(0)} = (x_1^{(0)},x_2^{(0)},\dots,x_n^{(0)})^T \quad (\text{初始向量}) \\ x_i^{(k+1)} = \frac{1}{a_{ii}} \left( b_i - \sum_{j=1}^{i-1} a_{ij} x_j^{(k+1)} - \sum_{j=i+1}^{n} a_{ij} x_j^{(k)} \right), \quad i=1,2,\dots,n; \ k=0,1,2,\dots \end{cases} \]

增量形式（工程常用）

工程编程中常使用增量形式，直观体现每一步的修正量：

\[\begin{cases} x_i^{(k+1)} = x_i^{(k)} + \Delta x_i \\ \Delta x_i = \frac{1}{a_{ii}} \left( b_i - \sum_{j=1}^{i-1} a_{ij} x_j^{(k+1)} - \sum_{j=1}^{n} a_{ij} x_j^{(k)} \right) \end{cases} \tag{6.17} \]

3. 高斯-塞德尔迭代的算法实现

算法6.1给出了高斯-塞德尔迭代的标准实现流程，核心是覆盖存储：算出来的新值直接覆盖旧值，无需额外数组。

算法6.1 高斯-塞德尔迭代法
输入：系数矩阵A∈R^{n×n}，右端项b，初始向量x，最大迭代次数N0
输出：迭代解x
1. 初始化：x_i ← 0.0 (i=1,2,…,n) （或初始向量x^{(0)}）
2. 迭代循环：对于k=1,2,…,N0
    3. 分量更新：对于i=1,2,…,n
        x_i ← (b_i - Σ_{j=1}^{i-1} a_{ij}x_j - Σ_{j=i+1}^n a_{ij}x_j) / a_{ii}
    4. 精度判断：若||x^{(k)} - x^{(k-1)}|| < 预设精度，跳出循环
5. 返回迭代解x

算法说明：迭代一次的运算量至多与矩阵\(A\)的非零元素个数一致，完美适配大型稀疏矩阵，零元素无需参与计算，内存和运算量优势显著。

4. 高斯-塞德尔迭代的核心特点

新值优先更新：计算\(x_i^{(k+1)}\)时，直接使用当前步已算出的\(x_1^{(k+1)},\dots,x_{i-1}^{(k+1)}\)，修正更及时，通常收敛速度快于雅可比迭代；
存储需求：仅需一套数组，新值直接覆盖旧值，内存占用仅为雅可比迭代的一半；
计算特性：每迭代一次仅需一次矩阵-向量乘法，但分量之间存在计算依赖（\(x_i\)依赖\(x_1\)到\(x_{i-1}\)），不适合并行计算，串行场景优势明显；
收敛性：收敛条件与雅可比迭代不完全等价，存在雅可比收敛但高斯-塞德尔发散的情况，反之亦然；在严格对角占优、对称正定等条件下，两种方法均收敛，且高斯-塞德尔收敛更快。

四、实例解析：两种方法的收敛速度对比

以例6.6的线性方程组为例，直观对比两种方法的计算过程与收敛效率。

例题方程组

\[\begin{cases} 8x_1 - 3x_2 + 2x_3 = 20 \\ 4x_1 + 11x_2 - x_3 = 33 \\ 6x_1 + 3x_2 + 12x_3 = 36 \end{cases} \]

精确解：\(x^* = (3, 2, 1)^T\)，初始向量取\(x^{(0)}=(0,0,0)^T\)，精度要求\(\|x^* - x^{(k)}\|_\infty < 10^{-6}\)。

1. 雅可比迭代公式与计算

\[\begin{cases} x_1^{(k+1)} = \frac{1}{8}(3x_2^{(k)} - 2x_3^{(k)} + 20) \\ x_2^{(k+1)} = \frac{1}{11}(-4x_1^{(k)} + x_3^{(k)} + 33) \\ x_3^{(k+1)} = \frac{1}{12}(-6x_1^{(k)} - 3x_2^{(k)} + 36) \end{cases} \]

第1步迭代结果：\(x^{(1)}=(2.5, 3, 3)^T\)
迭代至第14次，满足精度要求：\(x^{(14)}=(3.000001117, 2.000000623, 0.999998890)^T\)

2. 高斯-塞德尔迭代公式与计算

\[\begin{cases} x_1^{(k+1)} = \frac{1}{8}(3x_2^{(k)} - 2x_3^{(k)} + 20) \\ x_2^{(k+1)} = \frac{1}{11}(-4x_1^{(k+1)} + x_3^{(k)} + 33) \\ x_3^{(k+1)} = \frac{1}{12}(-6x_1^{(k+1)} - 3x_2^{(k+1)} + 36) \end{cases} \]

第1步迭代结果：\(x^{(1)}=(2.5, 2.0909, 1.2273)^T\)，已显著更接近精确解
迭代至第7次，满足精度要求：\(x^{(7)}=(3.000002012, 1.999998701, 0.999999318)^T\)

实例结论

在该算例中，高斯-塞德尔迭代的收敛速度约为雅可比迭代的2倍，达到相同精度所需迭代次数减少一半，核心原因是新值的及时利用加速了误差修正。

五、知识点结构化总结表

对比维度	雅可比迭代法（Jacobi）	高斯-塞德尔迭代法（Gauss-Seidel）
核心思想	全旧值更新，所有分量均使用上一步迭代结果	新值优先更新，已算出的分量直接使用当前步新值
分裂矩阵\(M\)	\(M=D\)（对角矩阵）	\(M=D-L\)（下三角矩阵）
迭代矩阵	\(J = D^{-1}(L+U) = I - D^{-1}A\)	\(G = (D-L)^{-1}U = I - (D-L)^{-1}A\)
分量计算公式核心	\(x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j≠i}a_{ij}x_j^{(k)}\right)\)	\(x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)} - \sum_{j=i+1}^n a_{ij}x_j^{(k)}\right)\)
存储需求	2套数组（旧值+新值），无法覆盖	1套数组，新值直接覆盖旧值，内存占用低
并行性	分量计算无依赖，天然适合并行计算	分量存在串行依赖，不适合并行计算
收敛速度	较慢，通常需要更多迭代次数	较快（收敛条件满足时），迭代次数约为雅可比的1/2
计算量/迭代步	每步1次矩阵-向量乘法，运算量与非零元个数成正比	每步1次矩阵-向量乘法，运算量与非零元个数成正比
适用场景	并行计算平台、大规模分布式求解	串行计算场景、内存受限的工程计算
收敛性前提	充要条件：谱半径\(\rho(J) < 1\)；充分条件：\(A\)严格对角占优/对称正定	充要条件：谱半径\(\rho(G) < 1\)；充分条件：\(A\)严格对角占优/对称正定

雅可比与高斯-塞德尔迭代法收敛性深度讲解与完整推导

作为迭代法工程应用的核心判据，两种迭代法的收敛性分析直接决定了算法的适用场景与可靠性。我将从通用收敛准则出发，完整推导特殊矩阵的收敛定理，结合实例验证两种方法的收敛性差异，最终形成体系化的收敛性判断框架。

一、迭代法收敛的通用充要条件（定理6.7）

定理内容

设线性方程组\(Ax=b\)，其中\(A=D-L-U\)为非奇异矩阵，且对角矩阵\(D\)非奇异（即\(a_{ii} \neq 0, i=1,2,\dots,n\)），则：

雅可比迭代法收敛的充要条件：迭代矩阵\(J=D^{-1}(L+U)\)的谱半径\(\rho(J) < 1\)；
高斯-塞德尔迭代法收敛的充要条件：迭代矩阵\(G=(D-L)^{-1}U\)的谱半径\(\rho(G) < 1\)。

推导与说明

该定理是迭代法基本定理（定理6.5）的直接推论：

单步定常迭代\(x^{(k+1)}=Bx^{(k)}+f\)对任意初始向量收敛的充要条件，是迭代矩阵\(B\)的谱半径\(\rho(B) < 1\)；
雅可比迭代的迭代矩阵为\(J=D^{-1}(L+U)\)，高斯-塞德尔迭代的迭代矩阵为\(G=(D-L)^{-1}U\)，直接代入基本定理即可得到上述结论。

补充：收敛的充分条件

由谱半径的基本性质\(\rho(B) \leq \|B\|\)（矩阵的谱半径不超过其任意一种从属范数），可直接得到收敛的充分非必要条件：

若雅可比迭代矩阵的某从属范数\(\|J\| < 1\)，则雅可比迭代收敛；
若高斯-塞德尔迭代矩阵的某从属范数\(\|G\| < 1\)，则高斯-塞德尔迭代收敛。

该条件的优势是无需计算特征值，仅通过范数计算即可快速判断收敛性，工程中常用∞-范数、1-范数快速校验。

二、对角占优矩阵的收敛性定理（定理6.8）

工程中大量线性方程组的系数矩阵具有对角占优特性，该定理给出了这类矩阵的收敛性保证，是工程中最常用的收敛判据。

前置定义

严格对角占优矩阵：对\(n\)阶矩阵\(A\)，若对每一行\(i=1,2,\dots,n\)，都满足
\[|a_{ii}| > \sum_{\substack{j=1 \\ j \neq i}}^n |a_{ij}| \]
即对角元的绝对值严格大于该行其余所有元素绝对值的和。
不可约矩阵：矩阵不能通过行、列的同步置换，变为分块上三角矩阵，通俗来说，方程组的变量无法拆分为两组互不关联的子系统。
弱对角占优矩阵：对所有行满足\(|a_{ii}| \geq \sum_{j \neq i} |a_{ij}|\)，且至少存在一行严格大于。

定理6.8 内容

设线性方程组\(Ax=b\)，满足以下任一条件时，雅可比迭代法与高斯-塞德尔迭代法均收敛：

\(A\)为严格对角占优矩阵；
\(A\)为不可约弱对角占优矩阵。

完整证明（以高斯-塞德尔迭代为例）

我们仅需证明：当\(A\)为严格对角占优矩阵时，高斯-塞德尔迭代矩阵\(G\)的谱半径\(\rho(G) < 1\)，雅可比迭代的证明思路完全一致。

步骤1：特征方程等价变形

高斯-塞德尔迭代矩阵为\(G=(D-L)^{-1}U\)，其特征方程为\(\det(\lambda I - G) = 0\)。代入\(G\)的表达式做变形：

\[\begin{align*} \det(\lambda I - G) &= \det\left(\lambda I - (D-L)^{-1}U\right) \\ &= \det\left( (D-L)^{-1} \cdot \left[ \lambda(D-L) - U \right] \right) \\ &= \det\left( (D-L)^{-1} \right) \cdot \det\left( \lambda(D-L) - U \right) \end{align*} \]

由于\(D\)非奇异（对角元非零），\(D-L\)是下三角矩阵，对角元为\(a_{ii} \neq 0\)，因此\(\det((D-L)^{-1}) \neq 0\)。

因此，特征方程\(\det(\lambda I - G)=0\)等价于：

\[\det\left( \lambda(D-L) - U \right) = 0 \]

步骤2：构造矩阵并分析对角占优性

记矩阵\(C = \lambda(D-L) - U\)，写出\(C\)的元素结构：

对角元：\(C_{ii} = \lambda a_{ii}\)
严格下三角（\(i>j\)）：\(C_{ij} = \lambda a_{ij}\)
严格上三角（\(i<j\)）：\(C_{ij} = a_{ij}\)

我们采用反证法：假设存在\(G\)的一个特征值\(\lambda\)满足\(|\lambda| \geq 1\)，我们将证明此时\(\det(C) \neq 0\)，与特征方程矛盾，因此所有特征值必须满足\(|\lambda| < 1\)。

当\(|\lambda| \geq 1\)时，分析\(C\)的第\(i\)行对角占优性：

对角元绝对值：\(|C_{ii}| = |\lambda a_{ii}| = |\lambda| \cdot |a_{ii}|\)
非对角元绝对值和：
\[\sum_{\substack{j=1 \\ j \neq i}}^n |C_{ij}| = \sum_{j=1}^{i-1} |\lambda a_{ij}| + \sum_{j=i+1}^n |a_{ij}| = |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| \]

由于\(A\)是严格对角占优矩阵，满足：

\[|a_{ii}| > \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| \]

两边同时乘以\(|\lambda| \geq 1\)，得：

\[|\lambda| \cdot |a_{ii}| > |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + |\lambda| \sum_{j=i+1}^n |a_{ij}| \]

由于\(|\lambda| \geq 1\)，因此\(|\lambda| \sum_{j=i+1}^n |a_{ij}| \geq \sum_{j=i+1}^n |a_{ij}|\)，代入上式得：

\[|\lambda| \cdot |a_{ii}| > |\lambda| \sum_{j=1}^{i-1} |a_{ij}| + \sum_{j=i+1}^n |a_{ij}| = \sum_{j \neq i} |C_{ij}| \]

即\(|C_{ii}| > \sum_{j \neq i} |C_{ij}|\)，因此矩阵\(C\)是严格对角占优矩阵。

步骤3：导出矛盾，完成证明

根据严格对角占优矩阵的核心性质：严格对角占优矩阵一定是非奇异矩阵，即\(\det(C) \neq 0\)，这与特征方程\(\det(C)=0\)矛盾。

因此假设不成立，\(G\)的所有特征值都满足\(|\lambda| < 1\)，即\(\rho(G) < 1\)，高斯-塞德尔迭代收敛。

三、对称正定矩阵的收敛性定理（定理6.9）

有限元、结构力学等工程问题中，系数矩阵大多为对称正定矩阵，该定理给出了这类矩阵的收敛性保证，是工程仿真中的核心判据。

定理6.9 内容

设矩阵\(A\)对称，且对角元\(a_{ii} > 0 \ (i=1,2,\dots,n)\)，则：

雅可比迭代法收敛的充要条件：\(A\)和\(2D-A\)均为正定矩阵；
高斯-塞德尔迭代法收敛的充分条件：\(A\)为对称正定矩阵。

核心解读

高斯-塞德尔迭代的收敛性条件更宽松：只要\(A\)对称正定，无需额外条件，高斯-塞德尔迭代一定收敛，这是极强的工程实用结论；
雅可比迭代的收敛性条件更严格：仅\(A\)正定不足以保证雅可比收敛，还需要\(2D-A\)也正定，否则可能出现“\(A\)正定但雅可比迭代发散”的情况；
两种迭代的收敛性不存在绝对的包含关系：存在雅可比收敛但高斯-塞德尔发散的矩阵，也存在高斯-塞德尔收敛但雅可比发散的矩阵。

四、实例完整推导（例6.7）

题目

线性方程组\(Ax=b\)的系数矩阵为：

\[A = \begin{pmatrix} 1 & a & a \\ a & 1 & a \\ a & a & 1 \end{pmatrix} \]

证明：

当\(-\frac{1}{2} < a < 1\)时，高斯-塞德尔迭代法收敛；
雅可比迭代法仅当\(-\frac{1}{2} < a < \frac{1}{2}\)时收敛。

1. 高斯-塞德尔迭代收敛性证明

根据定理6.9，对称正定矩阵的高斯-塞德尔迭代一定收敛，因此我们只需证明：当\(-\frac{1}{2} < a < 1\)时，\(A\)为对称正定矩阵。

对称矩阵正定的充要条件是：所有顺序主子式均大于0。我们逐阶计算\(A\)的顺序主子式：

一阶顺序主子式：\(D_1 = \det\begin{pmatrix}1\end{pmatrix} = 1 > 0\)，对任意\(a\)恒成立；
二阶顺序主子式：

\[D_2 = \det\begin{pmatrix}1 & a \\ a & 1\end{pmatrix} = 1 - a^2 > 0 \]
解得\(|a| < 1\)，即\(-1 < a < 1\)；
三阶顺序主子式（矩阵行列式）：

\[\begin{align*} D_3 = \det(A) &= 1 \cdot \det\begin{pmatrix}1 & a \\ a & 1\end{pmatrix} - a \cdot \det\begin{pmatrix}a & a \\ a & 1\end{pmatrix} + a \cdot \det\begin{pmatrix}a & 1 \\ a & a\end{pmatrix} \\ &= (1-a^2) - a(a - a^2) + a(a^2 - a) \\ &= 1 - 3a^2 + 2a^3 \end{align*} \]
因式分解得：\(D_3 = (1-a)^2(2a+1)\)。

由于\((1-a)^2 \geq 0\)，当\(a \neq 1\)时\((1-a)^2 > 0\)，因此\(D_3 > 0\)等价于\(2a+1 > 0\)，即\(a > -\frac{1}{2}\)。

综上，当\(-\frac{1}{2} < a < 1\)时，\(A\)的所有顺序主子式均大于0，\(A\)为对称正定矩阵，根据定理6.9，高斯-塞德尔迭代法收敛。

2. 雅可比迭代收敛性证明

根据定理6.7，雅可比迭代收敛的充要条件是迭代矩阵\(J\)的谱半径\(\rho(J) < 1\)，我们分步推导：

步骤1：构造雅可比迭代矩阵

将\(A\)拆分为\(A=D-L-U\)：

对角矩阵\(D = \text{diag}(1,1,1)\)，因此\(D^{-1}=I\)；
严格下三角矩阵\(L = \begin{pmatrix}0 & 0 & 0 \\ -a & 0 & 0 \\ -a & -a & 0\end{pmatrix}\)；
严格上三角矩阵\(U = \begin{pmatrix}0 & -a & -a \\ 0 & 0 & -a \\ 0 & 0 & 0\end{pmatrix}\)。

因此雅可比迭代矩阵：

\[J = D^{-1}(L+U) = L+U = \begin{pmatrix}0 & -a & -a \\ -a & 0 & -a \\ -a & -a & 0\end{pmatrix} \]

步骤2：求解特征值与谱半径

解特征方程\(\det(\lambda I - J) = 0\)：

\[\lambda I - J = \begin{pmatrix}\lambda & a & a \\ a & \lambda & a \\ a & a & \lambda\end{pmatrix} \]

计算行列式：

\[\det(\lambda I - J) = \lambda^3 - 3\lambda a^2 + 2a^3 \]

因式分解得：\(\det(\lambda I - J) = (\lambda - a)^2(\lambda + 2a) = 0\)。

因此\(J\)的特征值为\(\lambda_1=\lambda_2=a\)，\(\lambda_3=-2a\)，谱半径为：

\[\rho(J) = \max\left\{ |a|, |-2a| \right\} = |2a| \]

步骤3：收敛性判断

雅可比迭代收敛的充要条件是\(\rho(J) < 1\)，即\(|2a| < 1\)，解得\(|a| < \frac{1}{2}\)，即\(-\frac{1}{2} < a < \frac{1}{2}\)。

实例结论

当\(a \in (\frac{1}{2}, 1)\)时，\(A\)对称正定，高斯-塞德尔迭代收敛，但雅可比迭代的谱半径\(\rho(J)=|2a|>1\)，雅可比迭代发散，完美验证了定理6.9的结论。

五、收敛性判据结构化总结表

判据类型	雅可比迭代法	高斯-塞德尔迭代法	条件类型	工程适用场景
通用充要条件	迭代矩阵谱半径\(\rho(J) < 1\)，其中\(J=D^{-1}(L+U)\)	迭代矩阵谱半径\(\rho(G) < 1\)，其中\(G=(D-L)^{-1}U\)	充要条件	理论分析、低阶矩阵收敛性判断
通用充分条件	迭代矩阵的任意从属范数\(\|J\| < 1\)（如∞-范数、1-范数）	迭代矩阵的任意从属范数\(\|G\| < 1\)（如∞-范数、1-范数）	充分非必要	高阶矩阵快速收敛性校验
严格对角占优矩阵	收敛	收敛	充分条件	偏微分方程离散、电路仿真方程组
不可约弱对角占优矩阵	收敛	收敛	充分条件	大规模网络、结构力学方程组
对称正定矩阵	收敛充要条件：\(A\)和\(2D-A\)均正定	收敛充分条件：\(A\)对称正定	雅可比：充要；高斯-塞德尔：充分	有限元分析、优化问题、最小二乘求解
收敛速度对比	较慢，通常需要更多迭代次数	较快（收敛条件满足时），迭代次数约为雅可比的1/2	-	串行计算优先选高斯-塞德尔，并行计算优先选雅可比

posted on 2026-03-01 11:32 Indian_Mysore 阅读(84) 评论(0) 收藏举报

刷新页面返回顶部

昆仑山:眼中无形心中有穴之穴人合一

6.2雅可比迭代法与高斯-塞德尔迭代法

雅可比迭代法与高斯-塞德尔迭代法 深度讲解与完整推导

一、前置基础：系数矩阵的三部分拆分

拆分的正确性验证

二、雅可比迭代法（Jacobi Iteration）

1. 迭代格式的构造（矩阵分裂法）

迭代矩阵与常数项推导

2. 分量计算公式推导

3. 雅可比迭代的核心特点

三、高斯-塞德尔迭代法（Gauss-Seidel Iteration）

1. 迭代格式的构造（矩阵分裂法）

迭代矩阵与常数项推导

2. 分量计算公式推导

增量形式（工程常用）

3. 高斯-塞德尔迭代的算法实现

4. 高斯-塞德尔迭代的核心特点

四、实例解析：两种方法的收敛速度对比

例题方程组

1. 雅可比迭代公式与计算

2. 高斯-塞德尔迭代公式与计算

实例结论

五、知识点结构化总结表

雅可比与高斯-塞德尔迭代法收敛性 深度讲解与完整推导

一、迭代法收敛的通用充要条件（定理6.7）

定理内容

推导与说明

补充：收敛的充分条件

二、对角占优矩阵的收敛性定理（定理6.8）

前置定义

定理6.8 内容

完整证明（以高斯-塞德尔迭代为例）

步骤1：特征方程等价变形

步骤2：构造矩阵并分析对角占优性

步骤3：导出矛盾，完成证明

三、对称正定矩阵的收敛性定理（定理6.9）

定理6.9 内容

核心解读

四、实例完整推导（例6.7）

题目

1. 高斯-塞德尔迭代收敛性证明

2. 雅可比迭代收敛性证明

步骤1：构造雅可比迭代矩阵

步骤2：求解特征值与谱半径

步骤3：收敛性判断

实例结论

五、收敛性判据结构化总结表

导航

公告

雅可比迭代法与高斯-塞德尔迭代法深度讲解与完整推导

雅可比与高斯-塞德尔迭代法收敛性深度讲解与完整推导