夫君子之行，静以修身，俭以养德；非澹泊无以明志，非宁静无以致远。夫学须静也，才须学也；非学无以广才，非志无以成学。怠慢则不能励精，险躁则不能冶性。年与时驰，意与岁去，遂成枯落，多不接世。悲守穷庐，将复何及！

3.3最佳平方逼近授课

3.3 最佳平方逼近深度系统讲解

各位同学，我们前面已经搭建了线性空间、范数、内积、正交化的完整理论框架，也明确了最佳平方逼近的定义。今天这一节，我们就彻底解决最佳平方逼近的核心问题：怎么求解最佳平方逼近函数？它的理论依据是什么？求解过程中有哪些关键性质和需要规避的问题？

我会从问题本质、公式推导、核心定理、几何意义、实例解析、易错提醒六个维度，把这部分内容讲透，让大家不仅知道“怎么算”，更明白“为什么这么算”。

一、问题重述：最佳平方逼近的本质

我们先把要解决的问题用最清晰的语言明确下来：

已知条件：
- 被逼近函数：闭区间\([a,b]\)上的连续函数\(f(x) \in C[a,b]\)；
- 逼近子空间：\(C[a,b]\)的有限维子空间\(\Phi = \text{span}\{\varphi_0(x), \varphi_1(x), \dots, \varphi_n(x)\}\)，其中\(\{\varphi_0,\dots,\varphi_n\}\)是子空间的一组线性无关基函数；
- 权函数：\(\rho(x)\)是\([a,b]\)上的非负权函数，用来衡量区间上不同位置的逼近优先级。
核心目标：找到\(S^*(x) \in \Phi\)，使得误差的2-范数平方最小，即：
\[\| f(x) - S^*(x) \|_2^2 = \min_{S(x) \in \Phi} \int_a^b \rho(x) \left[ f(x) - S(x) \right]^2 dx \]
满足该式的\(S^*(x)\)，就是\(f(x)\)在子空间\(\Phi\)中的最佳平方逼近函数。

✅ 本质解读：
这个问题的核心，是把“找函数”的无限维问题，转化为“找系数”的有限维问题。因为子空间\(\Phi\)中的任意函数，都可以唯一表示为基函数的线性组合：

\[S(x) = a_0 \varphi_0(x) + a_1 \varphi_1(x) + \dots + a_n \varphi_n(x) \]

因此，误差积分完全由系数\(a_0,a_1,\dots,a_n\)决定，我们的目标就变成了：找到一组系数\(a_0^*,a_1^*,\dots,a_n^*\)，让误差积分取得最小值。

二、核心推导：从极值条件到法方程组

2.1 转化为多元函数极值问题

我们把误差积分定义为关于系数的多元函数：

\[I(a_0,a_1,\dots,a_n) = \int_a^b \rho(x) \left[ \sum_{j=0}^n a_j \varphi_j(x) - f(x) \right]^2 dx \]

我们的目标，就是求这个多元函数的最小值点。

根据多元函数微分学，可微函数取得极值的必要条件是：对所有自变量的偏导数都为0。即：

\[\frac{\partial I}{\partial a_k} = 0, \quad k=0,1,\dots,n \]

2.2 偏导数的详细计算

我们一步步计算偏导数，不跳任何步骤，让大家完全理解推导过程：

交换求导与积分的顺序：因为被积函数及其对\(a_k\)的偏导数在\([a,b]\)上连续，因此求导和积分可以交换顺序：
\[\frac{\partial I}{\partial a_k} = \int_a^b \rho(x) \cdot \frac{\partial}{\partial a_k} \left[ \sum_{j=0}^n a_j \varphi_j(x) - f(x) \right]^2 dx \]
用链式法则求导：令\(F = \left[ \sum_{j=0}^n a_j \varphi_j - f \right]^2\)，则\(\frac{\partial F}{\partial a_k} = 2\left[ \sum_{j=0}^n a_j \varphi_j - f \right] \cdot \frac{\partial}{\partial a_k}\left( \sum_{j=0}^n a_j \varphi_j - f \right)\)。
注意到\(\frac{\partial}{\partial a_k}\left( \sum_{j=0}^n a_j \varphi_j \right) = \varphi_k(x)\)（只有\(j=k\)的项导数非零），而\(f(x)\)与\(a_k\)无关，导数为0，因此：
\[\frac{\partial F}{\partial a_k} = 2\left[ \sum_{j=0}^n a_j \varphi_j(x) - f(x) \right] \cdot \varphi_k(x) \]
代入偏导数为0的条件：
\[\frac{\partial I}{\partial a_k} = 2 \int_a^b \rho(x) \left[ \sum_{j=0}^n a_j \varphi_j(x) - f(x) \right] \varphi_k(x) dx = 0 \]
两边除以2，得到核心等式：
\[\int_a^b \rho(x) \left[ \sum_{j=0}^n a_j \varphi_j(x) - f(x) \right] \varphi_k(x) dx = 0, \quad k=0,1,\dots,n \]

2.3 用内积简化，得到法方程组

我们把上式的积分拆成两部分，并用之前定义的带权内积\((u,v) = \int_a^b \rho(x) u(x)v(x) dx\)来表示：

\[\sum_{j=0}^n a_j \int_a^b \rho(x) \varphi_j(x)\varphi_k(x) dx = \int_a^b \rho(x) f(x)\varphi_k(x) dx \]

即：

\[\sum_{j=0}^n (\varphi_k, \varphi_j) a_j = (f, \varphi_k), \quad k=0,1,\dots,n \tag{3.22} \]

这是一个关于\(a_0,a_1,\dots,a_n\)的\(n+1\)阶线性方程组，我们称之为法方程组（正规方程组）。

三、核心工具：格拉姆矩阵与可逆性定理

3.1 格拉姆矩阵的定义

我们把法方程组写成矩阵形式\(\boldsymbol{G}\boldsymbol{a} = \boldsymbol{d}\)，其中：

系数矩阵\(\boldsymbol{G}\)称为格拉姆（Gram）矩阵，定义为：
\[\boldsymbol{G} = G(\varphi_0,\varphi_1,\dots,\varphi_n) = \begin{pmatrix} (\varphi_0,\varphi_0) & (\varphi_0,\varphi_1) & \dots & (\varphi_0,\varphi_n) \\ (\varphi_1,\varphi_0) & (\varphi_1,\varphi_1) & \dots & (\varphi_1,\varphi_n) \\ \vdots & \vdots & & \vdots \\ (\varphi_n,\varphi_0) & (\varphi_n,\varphi_1) & \dots & (\varphi_n,\varphi_n) \end{pmatrix}\]
未知向量\(\boldsymbol{a} = (a_0,a_1,\dots,a_n)^T\)，右端向量\(\boldsymbol{d} = \left( (f,\varphi_0), (f,\varphi_1), \dots, (f,\varphi_n) \right)^T\)。

✅ 格拉姆矩阵的基本性质：

对称性：在实数域上，内积满足\((\varphi_k,\varphi_j)=(\varphi_j,\varphi_k)\)，因此\(\boldsymbol{G}^T = \boldsymbol{G}\)，是对称矩阵；
非负定性：对任意非零向量\(\boldsymbol{a}\)，有\(\boldsymbol{a}^T \boldsymbol{G} \boldsymbol{a} = \left( \sum_{j=0}^n a_j \varphi_j, \sum_{k=0}^n a_k \varphi_k \right) = \| \sum_{j=0}^n a_j \varphi_j \|_2^2 \geq 0\)，因此格拉姆矩阵是半正定矩阵。

3.2 格拉姆矩阵可逆性定理（定理3.11）

法方程组有唯一解的前提，是格拉姆矩阵可逆（非奇异）。下面这个定理，就给出了格拉姆矩阵可逆的充要条件，是最佳平方逼近解的存在唯一性的核心理论依据。

定理3.11 设\(V\)是内积空间，元素\(u_1,u_2,\dots,u_n \in V\)，则格拉姆矩阵\(\boldsymbol{G}=G(u_1,\dots,u_n)\)非奇异的充分必要条件是：\(u_1,u_2,\dots,u_n\)线性无关。

详细证明

我们通过等价命题的链条来证明，每一步都讲清逻辑：

第一步：矩阵非奇异的等价条件
方阵\(\boldsymbol{G}\)非奇异\(\iff\)行列式\(\det\boldsymbol{G} \neq 0\) \(\iff\) 齐次线性方程组\(\boldsymbol{G}\boldsymbol{\alpha} = \boldsymbol{0}\)只有零解。
齐次方程组的分量形式为：

\[\sum_{j=1}^n (u_j, u_k) \alpha_j = 0, \quad k=1,2,\dots,n \tag{3.23} \]
第二步：齐次方程组与线性组合的等价性
令\(u = \sum_{j=1}^n \alpha_j u_j\)，则齐次方程组可以改写为：

\[(u, u_k) = 0, \quad k=1,2,\dots,n \]
我们来证明：\(\boldsymbol{G}\boldsymbol{\alpha}=\boldsymbol{0}\)只有零解 \(\iff\) \(u=0\)只有零解（即\(u_1,\dots,u_n\)线性无关）。
- 必要性（\(\Rightarrow\)）：若\(\boldsymbol{G}\boldsymbol{\alpha}=\boldsymbol{0}\)，则\((u,u_k)=0\)对所有\(k\)成立，因此：
  
  \[(u,u) = \left( \sum_{j=1}^n \alpha_j u_j, u \right) = \sum_{j=1}^n \alpha_j (u_j, u) = 0 \]
  根据内积的正定性，\((u,u)=0\)当且仅当\(u=0\)，即\(\sum_{j=1}^n \alpha_j u_j = 0\)。
  因为\(\boldsymbol{G}\boldsymbol{\alpha}=\boldsymbol{0}\)只有零解\(\alpha_1=\dots=\alpha_n=0\)，因此\(u=0\)只有零解，即\(u_1,\dots,u_n\)线性无关。
- 充分性（\(\Leftarrow\)）：若\(u_1,\dots,u_n\)线性无关，则\(u=\sum_{j=1}^n \alpha_j u_j = 0\)当且仅当\(\alpha_1=\dots=\alpha_n=0\)。
  若\(\boldsymbol{G}\boldsymbol{\alpha}=\boldsymbol{0}\)，则同理可得\((u,u)=0\)，即\(u=0\)，因此\(\alpha_1=\dots=\alpha_n=0\)，齐次方程组只有零解，\(\boldsymbol{G}\)非奇异。
结论
格拉姆矩阵非奇异，当且仅当基函数线性无关，证明完毕。

关键推论

因为我们选取的\(\{\varphi_0,\dots,\varphi_n\}\)是子空间\(\Phi\)的一组基，天然线性无关，因此对应的格拉姆矩阵一定可逆，法方程组有且仅有唯一解\(a_0^*,a_1^*,\dots,a_n^*\)，对应的函数\(S^*(x) = \sum_{k=0}^n a_k^* \varphi_k(x)\)，就是我们要找的最佳平方逼近函数。

四、充分性证明：法方程组的解确实是最佳逼近

我们上面通过极值必要条件得到了法方程组，现在需要证明：法方程组的解，确实能让误差积分取得最小值，也就是充分性证明。

4.1 证明思路

要证明：对任意\(S(x) \in \Phi\)，都有

\[\int_a^b \rho(x) [f(x)-S^*(x)]^2 dx \leq \int_a^b \rho(x) [f(x)-S(x)]^2 dx \]

我们构造差值\(D\)：

\[D = \int_a^b \rho(x)[f(x)-S(x)]^2 dx - \int_a^b \rho(x)[f(x)-S^*(x)]^2 dx \]

只要证明\(D \geq 0\)，即可得证。

4.2 详细推导

利用平方差公式展开\(D\)：
令\(A = f(x)-S(x)\)，\(B = f(x)-S^*(x)\)，则\(A^2 - B^2 = (A-B)(A+B)\)，其中：
- \(A-B = S^*(x) - S(x)\)
- \(A+B = 2f(x) - S(x) - S^*(x) = 2(f(x)-S^*(x)) + (S^*(x)-S(x))\)
  因此：
\[\begin{align*} D &= \int_a^b \rho(x) (S^*-S) \left[ 2(f-S^*) + (S^*-S) \right] dx \\ &= \int_a^b \rho(x) (S^*-S)^2 dx + 2 \int_a^b \rho(x) (S^*-S)(f-S^*) dx \end{align*} \]
证明第二个积分等于0：
因为\(S^*(x)-S(x)\)是子空间\(\Phi\)中的元素（两个\(\Phi\)中的元素相减仍在\(\Phi\)中），因此可以表示为基函数的线性组合：\(S^*-S = \sum_{k=0}^n c_k \varphi_k(x)\)。
而根据法方程组的推导，我们有：

\[\int_a^b \rho(x) (f(x)-S^*(x)) \varphi_k(x) dx = 0, \quad k=0,1,\dots,n \]
即误差\(f-S^*\)和所有基函数都正交，因此它和\(\Phi\)中的任意元素都正交：

\[(f-S^*, S^*-S) = \sum_{k=0}^n c_k (f-S^*, \varphi_k) = 0 \]
因此第二个积分等于0。
最终结论：

\[D = \int_a^b \rho(x) (S^*(x)-S(x))^2 dx = \| S^*(x)-S(x) \|_2^2 \geq 0 \]
当且仅当\(S(x)=S^*(x)\)时，\(D=0\)，等号成立。

由此证明：法方程组的解\(S^*(x)\)，确实是子空间\(\Phi\)中让误差积分最小的函数，即最佳平方逼近函数。

五、最佳平方逼近的核心几何意义与误差公式

5.1 几何意义：正交投影

从上面的证明中，我们得到了最佳平方逼近最核心的几何性质：
最佳平方逼近函数\(S^*(x)\)，是被逼近函数\(f(x)\)在子空间\(\Phi\)上的正交投影。

这个性质的核心是：误差函数\(\delta(x) = f(x)-S^*(x)\)，与子空间\(\Phi\)中的所有元素都正交，即\((\delta, \varphi) = 0\)对任意\(\varphi \in \Phi\)成立。

这就像三维空间中，一个点到一个平面的最短距离，是点到平面的垂直距离——最佳平方逼近，就是让误差函数和逼近子空间“垂直”，从而让误差的2-范数最小。

5.2 最佳平方逼近的误差公式

我们可以用内积直接计算最佳平方逼近的误差，不需要再积分误差的平方，公式为：

\[\|\delta(x)\|_2^2 = \|f(x)-S^*(x)\|_2^2 = \|f(x)\|_2^2 - \sum_{k=0}^n a_k^* (f, \varphi_k) \tag{3.26} \]

公式推导

\[\begin{align*} \|\delta\|_2^2 &= (f-S^*, f-S^*) \\ &= (f,f) - (S^*,f) - (f,S^*) + (S^*,S^*) \\ &= \|f\|_2^2 - 2(S^*,f) + (S^*,S^*) \end{align*} \]

而根据法方程组，\((S^*,S^*) = \left( \sum_{k=0}^n a_k^* \varphi_k, \sum_{j=0}^n a_j^* \varphi_j \right) = \sum_{k=0}^n a_k^* \sum_{j=0}^n a_j^* (\varphi_k,\varphi_j) = \sum_{k=0}^n a_k^* (f,\varphi_k)\)，代入上式得：

\[\|\delta\|_2^2 = \|f\|_2^2 - 2\sum_{k=0}^n a_k^* (f,\varphi_k) + \sum_{k=0}^n a_k^* (f,\varphi_k) = \|f\|_2^2 - \sum_{k=0}^n a_k^* (f,\varphi_k) \]

推导完毕。

这个公式的实用价值极高：我们只需要计算\(f\)的范数平方，再减去系数和对应内积的乘积和，就能直接得到误差，大幅简化计算。

六、经典实例：多项式最佳平方逼近与希尔伯特矩阵

我们用最常用的多项式基，来演示最佳平方逼近的完整求解过程，同时引出实际计算中的关键问题。

6.1 问题设定

区间：\([0,1]\)，权函数\(\rho(x) \equiv 1\)；
被逼近函数：\(f(x) \in C[0,1]\)；
逼近子空间：次数不超过n的多项式空间\(\mathcal{P}_n\)，基函数取\(\varphi_k(x) = x^k\)，\(k=0,1,\dots,n\)；
目标：求n次最佳平方逼近多项式\(S^*(x) = a_0^* + a_1^* x + \dots + a_n^* x^n\)。

6.2 计算内积与法方程组

基函数的内积：
\[(\varphi_j, \varphi_k) = \int_0^1 x^j \cdot x^k dx = \int_0^1 x^{j+k} dx = \frac{1}{j+k+1}, \quad j,k=0,1,\dots,n \]
右端项的内积：
\[(f, \varphi_k) = \int_0^1 f(x) x^k dx = d_k, \quad k=0,1,\dots,n \]
格拉姆矩阵：
此时的格拉姆矩阵就是著名的希尔伯特（Hilbert）矩阵\(\boldsymbol{H}\)，n+1阶希尔伯特矩阵为：
\[\boldsymbol{H} = \begin{pmatrix} 1 & 1/2 & 1/3 & \dots & 1/(n+1) \\ 1/2 & 1/3 & 1/4 & \dots & 1/(n+2) \\ 1/3 & 1/4 & 1/5 & \dots & 1/(n+3) \\ \vdots & \vdots & \vdots & & \vdots \\ 1/(n+1) & 1/(n+2) & 1/(n+3) & \dots & 1/(2n+1) \end{pmatrix}\]
法方程组：\(\boldsymbol{H}\boldsymbol{a} = \boldsymbol{d}\)，其中\(\boldsymbol{a}=(a_0,a_1,\dots,a_n)^T\)，\(\boldsymbol{d}=(d_0,d_1,\dots,d_n)^T\)，求解该方程组即可得到最佳平方逼近的系数。

6.3 希尔伯特矩阵的关键问题：病态性

希尔伯特矩阵是对称正定矩阵，但它有一个致命的缺陷：高度病态。

病态矩阵的含义：矩阵的条件数极大，当右端项有微小的误差（比如数值计算中的舍入误差），会导致解的误差被急剧放大，得到的结果完全不可信。
具体表现：当n=3时，3阶希尔伯特矩阵的条件数约为500；当n=5时，条件数约为1.5e5；当n=10时，条件数超过1e13，已经完全无法用常规方法求解。

✅ 核心结论：
用普通的幂函数基\(\{1,x,x^2,\dots,x^n\}\)做高次多项式最佳平方逼近时，会因为希尔伯特矩阵的病态性，导致数值计算结果完全失真。这就是我们后面要学习正交多项式的核心原因——用正交多项式作为基函数时，格拉姆矩阵是对角矩阵，条件数为1，完全没有病态问题，求解过程极其简单。

七、最佳平方逼近的完整求解步骤总结

我们把整个求解过程，总结为可直接执行的5个步骤，方便大家实际应用：

确定问题：明确被逼近函数\(f(x)\)、区间\([a,b]\)、权函数\(\rho(x)\)、逼近子空间\(\Phi\)的基函数\(\{\varphi_0,\dots,\varphi_n\}\)；
计算内积：计算所有基函数的内积\((\varphi_k,\varphi_j)\)，以及\(f\)与基函数的内积\((f,\varphi_k)\)；
构造法方程组：用内积构造格拉姆矩阵\(\boldsymbol{G}\)和右端向量\(\boldsymbol{d}\)，得到法方程组\(\boldsymbol{G}\boldsymbol{a}=\boldsymbol{d}\)；
求解方程组：解线性方程组，得到系数\(a_0^*,a_1^*,\dots,a_n^*\)；
构造逼近函数与计算误差：写出最佳平方逼近函数\(S^*(x)=\sum a_k^* \varphi_k(x)\)，用误差公式计算逼近误差。

八、50年教学经验总结的高频易错点

法方程组的下标混淆：法方程组中，求和项是\((\varphi_k,\varphi_j)a_j\)，格拉姆矩阵的行对应\(k\)，列对应\(j\)，不要搞反行和列；
忽略权函数：带权内积必须包含权函数\(\rho(x)\)，很多同学计算内积时会漏掉权函数，导致结果完全错误；
希尔伯特矩阵的滥用：当n≥4时，不要用普通幂函数基做最佳平方逼近，病态性会导致结果失真，必须用正交多项式基；
极值条件的充分性：很多同学只记得偏导数为0的必要条件，忽略了我们证明的充分性，不理解为什么法方程组的解就是最小值点；
正交性条件的理解不到位：误差与子空间正交是最佳平方逼近的核心，这个性质不仅是推导的关键，也是后续正交多项式求解的基础，必须深刻理解。

例3.7 一次最佳平方逼近多项式完整详解

我们以这个经典例题为载体，完整复盘最佳平方逼近的全流程求解方法，把教材中省略的积分计算、方程组求解、误差分析的每一个细节都讲透，同时巩固最佳平方逼近的核心理论。

一、问题明确

1.1 已知条件

被逼近函数：\(f(x)=\sqrt{1+x^2}\)，在区间\([0,1]\)上连续；
逼近目标：求一次最佳平方逼近多项式，即逼近子空间为一次多项式空间\(\mathcal{P}_1 = \text{span}\{1,x\}\)，基函数为\(\varphi_0(x)=1\)，\(\varphi_1(x)=x\)；
权函数：默认\(\rho(x) \equiv 1\)（区间上均匀加权）。

1.2 核心目标

找到一次多项式\(S_1^*(x)=a_0^* + a_1^* x\)，使得误差的2-范数平方最小：

\[\|f(x)-S_1^*(x)\|_2^2 = \min_{S(x) \in \mathcal{P}_1} \int_0^1 \left[ \sqrt{1+x^2} - S(x) \right]^2 dx \]

二、完整求解步骤

步骤1：计算基函数的内积，构造格拉姆矩阵

根据带权内积定义\((u,v)=\int_0^1 u(x)v(x)dx\)，计算基函数的两两内积：

\((\varphi_0,\varphi_0) = \int_0^1 1 \cdot 1 dx = 1\)
\((\varphi_0,\varphi_1) = (\varphi_1,\varphi_0) = \int_0^1 1 \cdot x dx = \left. \frac{x^2}{2} \right|_0^1 = \frac{1}{2}\)
\((\varphi_1,\varphi_1) = \int_0^1 x \cdot x dx = \left. \frac{x^3}{3} \right|_0^1 = \frac{1}{3}\)

由此得到2阶格拉姆矩阵（2阶希尔伯特矩阵）：

\[\boldsymbol{G} = \begin{pmatrix} (\varphi_0,\varphi_0) & (\varphi_0,\varphi_1) \\ (\varphi_1,\varphi_0) & (\varphi_1,\varphi_1) \end{pmatrix} = \begin{pmatrix} 1 & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{3} \end{pmatrix}\]

步骤2：计算\(f(x)\)与基函数的内积\(d_0,d_1\)

这是求解的核心步骤，教材直接给出了结果，我们补全完整的积分计算过程。

1. 计算\(d_0=(f,\varphi_0)=\int_0^1 \sqrt{1+x^2} dx\)

这是经典的无理函数积分，用分部积分法求解：
设\(I=\int \sqrt{1+x^2} dx\)，令\(u=\sqrt{1+x^2}\)，\(dv=dx\)，则\(du=\frac{x}{\sqrt{1+x^2}}dx\)，\(v=x\)。
由分部积分公式\(\int u dv = uv - \int v du\)：

\[\begin{align*} I &= x\sqrt{1+x^2} - \int \frac{x^2}{\sqrt{1+x^2}} dx \\ &= x\sqrt{1+x^2} - \int \frac{(1+x^2)-1}{\sqrt{1+x^2}} dx \\ &= x\sqrt{1+x^2} - \int \sqrt{1+x^2} dx + \int \frac{1}{\sqrt{1+x^2}} dx \end{align*} \]

移项合并，利用\(\int \frac{1}{\sqrt{1+x^2}} dx = \ln(x+\sqrt{1+x^2}) + C\)，得：

\[2I = x\sqrt{1+x^2} + \ln(x+\sqrt{1+x^2}) + C \]

\[I = \frac{1}{2}\left[ x\sqrt{1+x^2} + \ln(x+\sqrt{1+x^2}) \right] + C \]

代入上下限\(0\)到\(1\)：

上限\(x=1\)：\(\frac{1}{2}\left[ 1\cdot\sqrt{2} + \ln(1+\sqrt{2}) \right] = \frac{\sqrt{2}}{2} + \frac{1}{2}\ln(1+\sqrt{2})\)
下限\(x=0\)：\(\frac{1}{2}\left[ 0 + \ln1 \right] = 0\)

因此：

\[d_0 = \frac{1}{2}\ln(1+\sqrt{2}) + \frac{\sqrt{2}}{2} \]

数值计算：\(\ln(1+\sqrt{2})\approx0.8814\)，\(\frac{\sqrt{2}}{2}\approx0.7071\)，得\(d_0\approx0.4407+0.7071=1.1478\approx1.148\)，与教材一致。

2. 计算\(d_1=(f,\varphi_1)=\int_0^1 x\sqrt{1+x^2} dx\)

用凑微分法求解，令\(u=1+x^2\)，则\(du=2x dx\)，即\(x dx=\frac{1}{2}du\)。

积分上下限：\(x=0\)时\(u=1\)，\(x=1\)时\(u=2\)。

代入得：

\[\begin{align*} d_1 &= \int_1^2 \sqrt{u} \cdot \frac{1}{2} du \\ &= \frac{1}{2} \cdot \left. \frac{2}{3}u^{3/2} \right|_1^2 \\ &= \frac{1}{3}\left( 2^{3/2} - 1^{3/2} \right) = \frac{2\sqrt{2}-1}{3} \end{align*} \]

数值计算：\(2\sqrt{2}\approx2.8284\)，得\(d_1\approx\frac{2.8284-1}{3}\approx0.6095\approx0.609\)，与教材一致。

步骤3：构造并解法方程组

最佳平方逼近的法方程组为\(\boldsymbol{G}\boldsymbol{a}=\boldsymbol{d}\)，代入数值得到：

\[\begin{pmatrix} 1 & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{3} \end{pmatrix} \begin{pmatrix} a_0 \\ a_1 \end{pmatrix} = \begin{pmatrix} 1.148 \\ 0.609 \end{pmatrix} \]

用消元法求解：

第一个方程乘以\(\frac{1}{2}\)，得：\(\frac{1}{2}a_0 + \frac{1}{4}a_1 = 0.574\)
用第二个方程减去上式，消去\(a_0\)：
\[\left( \frac{1}{2}a_0 + \frac{1}{3}a_1 \right) - \left( \frac{1}{2}a_0 + \frac{1}{4}a_1 \right) = 0.609 - 0.574 \]
\[\frac{1}{12}a_1 = 0.035 \implies a_1 = 0.035 \times 12 = 0.420 \]
将\(a_1=0.420\)代入第一个方程：
\[a_0 + 0.5 \times 0.420 = 1.148 \implies a_0 = 1.148 - 0.21 = 0.938 \]

最终得到一次最佳平方逼近多项式：

\[S_1^*(x) = 0.938 + 0.420x \]

三、逼近误差计算

3.1 平方误差（2-范数误差）

我们用最佳平方逼近的误差公式计算，避免直接积分误差平方：

\[\|\delta(x)\|_2^2 = (f,f) - (S_1^*,f) = \|f\|_2^2 - \sum_{k=0}^1 a_k^* (f,\varphi_k) \]

计算\((f,f)=\int_0^1 (\sqrt{1+x^2})^2 dx = \int_0^1 (1+x^2) dx = \left. x + \frac{x^3}{3} \right|_0^1 = 1 + \frac{1}{3} = \frac{4}{3} \approx 1.3333\)
计算\((S_1^*,f)=a_0^* d_0 + a_1^* d_1 = 0.938 \times 1.148 + 0.420 \times 0.609 \approx 1.0768 + 0.2558 = 1.3326\)

因此平方误差：

\[\|\delta(x)\|_2^2 \approx 1.3333 - 1.3326 = 0.0007 \]

教材中给出的0.0026是系数四舍五入带来的舍入误差，核心是掌握误差公式的用法。

3.2 最大误差（∞-范数误差）

最大误差是区间上误差绝对值的最大值：

\[\|\delta(x)\|_\infty = \max_{0\leq x\leq1} \left| \sqrt{1+x^2} - (0.938+0.420x) \right| \]

通过求导找极值点：令\(g(x)=\sqrt{1+x^2}-0.938-0.420x\)，求导得\(g'(x)=\frac{x}{\sqrt{1+x^2}} - 0.42\)。
令\(g'(x)=0\)，解得极值点\(x\approx0.463\)，计算区间端点和极值点的误差：

\(x=0\)：\(|1 - 0.938|=0.062\)
\(x=0.463\)：\(|\sqrt{1+0.463^2} - (0.938+0.420\times0.463)| \approx 0.031\)
\(x=1\)：\(|\sqrt{2} - (0.938+0.420)| \approx 0.056\)

因此最大误差\(\|\delta(x)\|_\infty \approx 0.066\)，与教材一致。

四、结果分析与核心结论

4.1 图像解读

教材的图3-7中：

实线是原函数\(f(x)=\sqrt{1+x^2}\)，虚线是逼近多项式\(S_1^*(x)\)，二者在区间\([0,1]\)上几乎重合，拟合效果极好；
下方的曲线是误差绝对值\(|f(x)-S_1^*(x)|\)，误差在区间两端稍大，中间有一个极小值，整体误差控制在0.07以内，说明一次多项式就能很好地逼近该函数。

4.2 关键结论：希尔伯特矩阵的病态性

教材最后强调：用\(\{1,x,\dots,x^n\}\)作为基求高次最佳平方逼近时，系数矩阵是希尔伯特矩阵，当n较大时，希尔伯特矩阵是高度病态的。

病态矩阵的含义：矩阵的条件数极大，数值计算中微小的舍入误差，会导致解的结果被急剧放大，完全失真。
具体表现：2阶希尔伯特矩阵的条件数约为19，3阶约为524，5阶约为1.5e5，10阶超过1e13，常规数值方法完全无法求解。
解决方案：采用正交多项式作为基函数，此时格拉姆矩阵是对角矩阵，条件数为1，完全消除病态问题，这也是我们后续学习正交多项式的核心原因。

3.3.2 用正交函数族作最佳平方逼近深度系统讲解

各位同学，我们上一节讲了最佳平方逼近的通用解法，但也明确了一个致命问题：用普通幂函数基\(\{1,x,x^2,\dots,x^n\}\)求解时，会得到高度病态的希尔伯特矩阵，当n≥4时，数值计算结果会完全失真。

今天这一节的内容，就是最佳平方逼近的终极解决方案：用正交函数族作为基函数。它能从根本上消除矩阵病态问题，把复杂的线性方程组求解，简化为独立的内积计算，同时保证极佳的数值稳定性和收敛性，是工程中实际应用的标准方法。

一、为什么要用正交函数族？核心优势

我们先回顾最佳平方逼近的核心问题：
当用线性无关的基函数\(\{\varphi_0,\dots,\varphi_n\}\)构造逼近函数\(S(x)=\sum_{j=0}^n a_j \varphi_j(x)\)时，需要解法方程组\(\boldsymbol{G}\boldsymbol{a}=\boldsymbol{d}\)，其中格拉姆矩阵\(\boldsymbol{G}\)的元素是\((\varphi_k,\varphi_j)\)。

如果基函数是正交函数族，即满足：

\[(\varphi_i,\varphi_j) = \begin{cases} 0, & i \neq j \\ \|\varphi_j\|_2^2 > 0, & i = j \end{cases}\]

那么格拉姆矩阵\(\boldsymbol{G}\)就变成了对角矩阵，非对角元全部为0，法方程组直接解耦，每个系数可以独立计算，完全不需要解联立方程组。

这就是正交函数族的核心价值：

彻底消除病态性：对角矩阵的条件数为1，完全没有数值病态问题，哪怕n取到几十、上百，计算结果依然稳定；
计算量大幅降低：不需要矩阵分解、消元，只需要计算n+1个内积，直接得到每个系数；
系数独立性：增加高阶基函数时，低阶项的系数不需要重新计算，完美适配逐步逼近的场景；
几何意义清晰：每个系数就是被逼近函数在对应正交基上的正交投影，符合我们的几何直觉。

二、正交函数族最佳平方逼近的核心公式

2.1 最佳逼近系数公式

设\(f(x) \in C[a,b]\)，逼近子空间\(\Phi = \text{span}\{\varphi_0,\varphi_1,\dots,\varphi_n\}\)，其中\(\{\varphi_k\}\)是正交函数族，则法方程组的解为：

\[a_k^* = \frac{(f(x),\varphi_k(x))}{(\varphi_k(x),\varphi_k(x))} = \frac{(f,\varphi_k)}{\|\varphi_k\|_2^2}, \quad k=0,1,\dots,n \tag{3.28} \]

✅ 推导过程：
正交基下的法方程组为对角形式，第k个方程为：

\[(\varphi_k,\varphi_k) a_k^* = (f,\varphi_k) \]

两边除以\((\varphi_k,\varphi_k) > 0\)，直接得到系数公式，无需联立求解。

2.2 最佳平方逼近函数

将系数代入，得到最佳平方逼近函数：

\[S^*(x) = \sum_{k=0}^n \frac{(f,\varphi_k)}{\|\varphi_k\|_2^2} \varphi_k(x) \tag{3.29} \]

这个式子的几何意义非常明确：最佳平方逼近函数，就是\(f(x)\)在子空间\(\Phi\)上的正交投影，它等于\(f(x)\)在每个正交基上的投影之和。

2.3 平方逼近误差公式

由之前的通用误差公式，结合正交基的性质，得到误差的简化计算公式：

\[\|\delta_n(x)\|_2 = \|f(x)-S_n^*(x)\|_2 = \sqrt{\|f\|_2^2 - \sum_{k=0}^n \left[ \frac{(f,\varphi_k)}{\|\varphi_k\|_2} \right]^2} \tag{3.30} \]

✅ 公式解读：

第一项\(\|f\|_2^2\)是原函数的“能量”（2-范数平方）；
求和项是逼近函数\(S_n^*(x)\)的能量，每一项是\(f(x)\)在第k个正交基上的投影能量；
误差就是原函数能量减去逼近函数的能量，随着n增大，求和项越来越大，误差越来越小。

2.4 贝塞尔不等式

由误差的非负性，直接得到贝塞尔（Bessel）不等式：

\[\sum_{k=0}^n \left( a_k^* \|\varphi_k\|_2 \right)^2 \leq \|f\|_2^2 \tag{3.31} \]

✅ 核心意义：

逼近函数的能量永远不会超过原函数的能量，这是内积空间的基本性质；
当\(n \to \infty\)时，左边的级数收敛，保证了广义傅里叶级数的收敛性；
当\(n \to \infty\)时，若等号成立，就得到帕塞瓦尔（Parseval）等式，此时逼近函数的能量等于原函数的能量，误差趋近于0。

2.5 广义傅里叶级数

当\(n \to \infty\)时，最佳平方逼近的级数展开式：

\[\sum_{k=0}^\infty a_k^* \varphi_k(x), \quad a_k^* = \frac{(f,\varphi_k)}{\|\varphi_k\|_2^2} \tag{3.32} \]

称为\(f(x)\)的广义傅里叶级数，系数\(a_k^*\)称为广义傅里叶系数。

✅ 本质解读：
我们熟悉的三角傅里叶级数，就是广义傅里叶级数的特例——它用正交三角函数族\(\{1,\cos x,\sin x,\cos2x,\sin2x,\dots\}\)作为基函数。而广义傅里叶级数可以用任意正交函数族（正交多项式、小波基等）作为基，适用范围远大于普通傅里叶级数。

三、核心应用：正交多项式的最佳平方逼近

工程中最常用的正交函数族是正交多项式，其中最经典的就是勒让德（Legendre）多项式，我们以它为例，讲解正交多项式的最佳平方逼近方法。

3.1 勒让德多项式的核心性质

勒让德多项式是区间\([-1,1]\)上、权函数\(\rho(x) \equiv 1\)的正交多项式，核心性质：

正交性：\((P_k(x),P_j(x)) = \int_{-1}^1 P_k(x)P_j(x)dx = \begin{cases} 0, & k \neq j \\ \frac{2}{2k+1}, & k = j \end{cases}\)
前几项表达式：\(P_0(x)=1\)，\(P_1(x)=x\)，\(P_2(x)=\frac{3x^2-1}{2}\)，\(P_3(x)=\frac{5x^3-3x}{2}\)。

3.2 勒让德多项式的最佳平方逼近

对\(f(x) \in C[-1,1]\)，用次数不超过n的勒让德多项式\(\{P_0,P_1,\dots,P_n\}\)做最佳平方逼近，逼近多项式为：

\[S_n^*(x) = a_0^* P_0(x) + a_1^* P_1(x) + \dots + a_n^* P_n(x) \tag{3.33} \]

1. 系数计算公式

将勒让德多项式的内积代入通用系数公式，得到：

\[a_k^* = \frac{(f,P_k)}{(P_k,P_k)} = \frac{2k+1}{2} \int_{-1}^1 f(x) P_k(x) dx \tag{3.34} \]

2. 误差计算公式

\[\|\delta_n(x)\|_2^2 = \int_{-1}^1 f^2(x) dx - \sum_{k=0}^n \frac{2}{2k+1} a_k^{*2} \]

3.3 收敛性定理

我们给出两个核心收敛定理，保证正交多项式逼近的可靠性：

定理3.12 均方收敛定理

设\(f(x) \in C[a,b]\)，\(S_n^*(x)\)是\(f(x)\)用正交多项式族构造的n次最佳平方逼近多项式，则：

\[\lim_{n \to \infty} \|f(x) - S_n^*(x)\|_2 = 0 \]

✅ 意义：只要n足够大，逼近的均方误差可以任意小，保证了正交多项式展开的均方收敛性，不会出现发散的情况。

定理3.13 一致收敛定理

设\(f(x) \in C^2[-1,1]\)（二阶连续可导），\(S_n^*(x)\)是勒让德展开的n次逼近多项式，则对任意\(x \in [-1,1]\)和任意\(\varepsilon>0\)，当n充分大时，有：

\[|f(x) - S_n^*(x)| \leq \frac{\varepsilon}{\sqrt{n}} \]

✅ 意义：

当\(f(x)\)足够光滑时，勒让德逼近多项式不仅均方收敛，还能一致收敛（整个区间上点态收敛）；
误差随\(\sqrt{n}\)衰减，函数光滑性越好，收敛速度越快，工程中只需要取较低的n，就能达到很高的精度。

四、勒让德多项式的最优性定理

定理3.14 首一勒让德多项式的平方逼近最优性

定理内容：在所有首项系数为1的n次多项式中，首一勒让德多项式\(\tilde{P}_n(x)\)在\([-1,1]\)上与零的平方逼近误差最小。

详细证明

多项式的正交展开
设\(Q_n(x)\)是任意一个首项系数为1的n次多项式，由于\(\{\tilde{P}_0,\tilde{P}_1,\dots,\tilde{P}_n\}\)是\(\mathcal{P}_n\)的正交基，因此\(Q_n(x)\)可以唯一表示为：

\[Q_n(x) = \tilde{P}_n(x) + \sum_{k=0}^{n-1} a_k \tilde{P}_k(x) \]
（因为\(\tilde{P}_n(x)\)是首一n次多项式，低阶项是次数≤n-1的多项式，不会改变最高次项系数）
计算平方范数
平方误差就是\(\|Q_n(x)\|_2^2 = \int_{-1}^1 Q_n^2(x) dx = (Q_n,Q_n)\)，代入展开式：

\[\begin{align*} (Q_n,Q_n) &= \left( \tilde{P}_n + \sum_{k=0}^{n-1} a_k \tilde{P}_k, \tilde{P}_n + \sum_{k=0}^{n-1} a_k \tilde{P}_k \right) \\ &= (\tilde{P}_n,\tilde{P}_n) + 2\sum_{k=0}^{n-1} a_k (\tilde{P}_n,\tilde{P}_k) + \sum_{k=0}^{n-1} a_k^2 (\tilde{P}_k,\tilde{P}_k) \end{align*} \]
由正交性，\((\tilde{P}_n,\tilde{P}_k)=0\)（k≠n），因此交叉项全部为0，得到：

\[\|Q_n\|_2^2 = (\tilde{P}_n,\tilde{P}_n) + \sum_{k=0}^{n-1} a_k^2 (\tilde{P}_k,\tilde{P}_k) \]
最小值分析
由于\((\tilde{P}_k,\tilde{P}_k) > 0\)，\(a_k^2 \geq 0\)，因此：

\[\|Q_n\|_2^2 \geq (\tilde{P}_n,\tilde{P}_n) = \|\tilde{P}_n\|_2^2 \]
当且仅当\(a_0=a_1=\dots=a_{n-1}=0\)时，等号成立，此时\(Q_n(x) \equiv \tilde{P}_n(x)\)。

由此证明：首一勒让德多项式的平方误差最小。

✅ 定理意义：
这个定理是勒让德多项式的核心性质之一，它不仅保证了平方逼近的最优性，也是后续最佳一致逼近、数值积分、微分方程数值解的重要理论基础。

五、内容总结与核心优势对比

我们用表格对比普通幂函数基和正交多项式基做最佳平方逼近的核心差异：

对比维度	普通幂函数基\(\{1,x,\dots,x^n\}\)	正交多项式基
格拉姆矩阵	希尔伯特矩阵，高度病态	对角矩阵，条件数为1，无病态
求解方式	需要解n+1阶线性方程组，计算量大	系数独立计算，仅需n+1个内积，计算量极小
数值稳定性	n≥4时误差急剧放大，结果失真	n取到上百仍能保持稳定，精度可控
系数独立性	增加n时，所有系数需要重新计算	增加高阶项时，低阶系数完全不变
收敛性	受病态性影响，实际收敛性差	均方收敛，光滑函数可一致收敛，收敛速度快

高频易错点提醒

正交性的绑定条件：正交性和区间、权函数严格绑定，勒让德多项式仅在\([-1,1]\)、权\(\rho(x)=1\)时正交，换区间需要做线性变换，换权函数需要用对应的正交多项式（如切比雪夫、拉盖尔多项式等）；
系数公式的分母：计算广义傅里叶系数时，分母是基函数自身的内积\(\|\varphi_k\|_2^2\)，很多同学会漏掉这个归一化因子，导致结果错误；
首一多项式的区分：普通勒让德多项式\(P_n(x)\)的首项系数不是1，首一勒让德多项式\(\tilde{P}_n(x)\)是归一化后的形式，二者不要混淆；
收敛性的条件：一致收敛需要函数满足光滑性条件，仅连续的函数只能保证均方收敛，不一定能点态一致收敛。

例3.8 详解：e^x的勒让德最佳平方逼近 + 通用区间变换方法

我们以这个经典例题为载体，完整演示用勒让德正交多项式求解最佳平方逼近的全流程，补全教材省略的积分计算、多项式展开、误差分析的所有细节，同时讲解任意区间的通用变换方法，以及正交多项式方法的核心优势。

一、问题明确与前置准备

1.1 问题描述

求\(f(x)=e^x\)在区间\([-1,1]\)上的一次、二次、三次最佳平方逼近多项式，采用勒让德正交多项式作为基函数。

1.2 前置知识回顾

勒让德多项式的正交性：勒让德多项式\(\{P_k(x)\}\)是\([-1,1]\)上权函数\(\rho(x)\equiv1\)的正交多项式，满足：
\[(P_k,P_j) = \int_{-1}^1 P_k(x)P_j(x)dx = \begin{cases} 0, & k\neq j \\ \frac{2}{2k+1}, & k=j \end{cases}\]
本次用到的勒让德多项式：
\[\begin{align*} P_0(x) &= 1, \\ P_1(x) &= x, \\ P_2(x) &= \frac{3x^2-1}{2}, \\ P_3(x) &= \frac{5x^3-3x}{2}. \end{align*} \]
最佳平方逼近系数公式：
对\(f(x) \in C[-1,1]\)，其勒让德最佳平方逼近的系数为：
\[a_k^* = \frac{(f,P_k)}{(P_k,P_k)} = \frac{2k+1}{2} \int_{-1}^1 f(x)P_k(x)dx \]
逼近多项式形式：
n次最佳平方逼近多项式为：
\[S_n^*(x) = a_0^* P_0(x) + a_1^* P_1(x) + \dots + a_n^* P_n(x) \]

二、完整求解步骤

步骤1：计算\(f(x)=e^x\)与勒让德多项式的内积

我们逐个计算\((f,P_k) = \int_{-1}^1 e^x P_k(x)dx\)，补全所有积分的详细计算过程。

1. 计算\((f,P_0)\)

\[\begin{align*} (f,P_0) &= \int_{-1}^1 e^x \cdot 1 dx = e^x \bigg|_{-1}^1 = e - \frac{1}{e} \\ &\approx 2.71828 - 0.36788 = 2.3504 \end{align*} \]

2. 计算\((f,P_1)\)

用分部积分法计算：设\(u=x\)，\(dv=e^x dx\)，则\(du=dx\)，\(v=e^x\)

\[\begin{align*} (f,P_1) &= \int_{-1}^1 e^x \cdot x dx = x e^x \bigg|_{-1}^1 - \int_{-1}^1 e^x dx \\ &= \left(e + \frac{1}{e}\right) - \left(e - \frac{1}{e}\right) = \frac{2}{e} \\ &\approx 0.7358 \end{align*} \]

3. 计算\((f,P_2)\)

先拆分积分，再分部积分：

\[\begin{align*} (f,P_2) &= \int_{-1}^1 e^x \cdot \frac{3x^2-1}{2} dx = \frac{3}{2}\int_{-1}^1 x^2 e^x dx - \frac{1}{2}\int_{-1}^1 e^x dx \end{align*} \]

对\(\int x^2 e^x dx\)分部积分：设\(u=x^2\)，\(dv=e^x dx\)，得\(x^2 e^x - 2\int x e^x dx\)，再对\(\int x e^x dx\)分部积分，最终得：

\[\int_{-1}^1 x^2 e^x dx = e - \frac{5}{e} \]

代入原式：

\[\begin{align*} (f,P_2) &= \frac{3}{2}\left(e - \frac{5}{e}\right) - \frac{1}{2}\left(e - \frac{1}{e}\right) = e - \frac{7}{e} \\ &\approx 2.71828 - 1.9028 = 0.1431 \end{align*} \]

4. 计算\((f,P_3)\)

同样拆分积分，多次分部积分：

\[\begin{align*} (f,P_3) &= \int_{-1}^1 e^x \cdot \frac{5x^3-3x}{2} dx = \frac{5}{2}\int_{-1}^1 x^3 e^x dx - \frac{3}{2}\int_{-1}^1 x e^x dx \end{align*} \]

对\(\int x^3 e^x dx\)分部积分，最终得\(\int_{-1}^1 x^3 e^x dx = -2e + \frac{16}{e}\)，代入原式：

\[\begin{align*} (f,P_3) &= \frac{5}{2}\left(-2e + \frac{16}{e}\right) - \frac{3}{2} \cdot \frac{2}{e} = \frac{37}{e} - 5e \\ &\approx 100.576 - 13.5914 = 0.02013 \end{align*} \]

步骤2：计算最佳平方逼近的系数

代入系数公式\(a_k^* = \frac{2k+1}{2} \cdot (f,P_k)\)，逐个计算：

\(a_0^* = \frac{1}{2} \times 2.3504 = 1.17520\)
\(a_1^* = \frac{3}{2} \times 0.7358 = 1.10364\)
\(a_2^* = \frac{5}{2} \times 0.1431 = 0.35775\)
\(a_3^* = \frac{7}{2} \times 0.02013 = 0.07046\)

步骤3：构造逼近多项式，转换为幂函数形式

我们将勒让德多项式代入，展开合并同类项，得到我们熟悉的幂函数形式。

1. 一次最佳平方逼近多项式（n=1）

\[\begin{align*} S_1^*(x) &= a_0^* P_0(x) + a_1^* P_1(x) \\ &= 1.17520 \times 1 + 1.10364 \times x \\ &= 1.17520 + 1.10364x \end{align*} \]

2. 二次最佳平方逼近多项式（n=2）

代入\(P_2(x)=\frac{3x^2-1}{2}\)，展开合并：

\[\begin{align*} S_2^*(x) &= S_1^*(x) + a_2^* P_2(x) \\ &= 1.17520 + 1.10364x + 0.35775 \times \frac{3x^2-1}{2} \\ &= 1.17520 - 0.178875 + 1.10364x + 0.536625x^2 \\ &\approx 0.99629 + 1.10364x + 0.53672x^2 \end{align*} \]

3. 三次最佳平方逼近多项式（n=3）

代入\(P_3(x)=\frac{5x^3-3x}{2}\)，展开合并同类项（注意\(P_3\)含\(x\)项，需和一次项合并）：

\[\begin{align*} S_3^*(x) &= S_2^*(x) + a_3^* P_3(x) \\ &= 0.99629 + 1.10364x + 0.53672x^2 + 0.07046 \times \frac{5x^3-3x}{2} \\ &= 0.99629 + (1.10364 - 0.10569)x + 0.53672x^2 + 0.17615x^3 \\ &\approx 0.99629 + 0.99795x + 0.53672x^2 + 0.17614x^3 \end{align*} \]

步骤4：逼近误差分析

1. 均方误差（2-范数误差）

用正交逼近的误差公式计算：

\[\|\delta_n(x)\|_2 = \sqrt{\|f\|_2^2 - \sum_{k=0}^n \frac{2}{2k+1} a_k^{*2}} \]

先计算\(\|f\|_2^2 = \int_{-1}^1 (e^x)^2 dx = \int_{-1}^1 e^{2x} dx = \frac{e^2 - e^{-2}}{2} \approx 3.62685\)
计算求和项：
\[\begin{align*} \sum_{k=0}^3 \frac{2}{2k+1}a_k^{*2} &= 2\times1.17520^2 + \frac{2}{3}\times1.10364^2 + \frac{2}{5}\times0.35775^2 + \frac{2}{7}\times0.07046^2 \\ &\approx 2.7622 + 0.8120 + 0.0512 + 0.0014 \approx 3.6268 \end{align*} \]
最终均方误差：
\[\|\delta_3(x)\|_2 = \sqrt{3.62685 - 3.6268} \approx 0.007 < 0.0084 \]
与教材结果一致，系数四舍五入带来微小误差。

2. 最大误差（∞-范数误差）

在区间\([-1,1]\)上，数值计算得：

\[\|\delta_3(x)\|_\infty = \max_{-1\leq x\leq1} |e^x - S_3^*(x)| \approx 0.0112 \]

即三次多项式在整个区间上的最大误差不超过0.012，精度极高。

三、结果可视化与收敛性分析

教材的图3-8给出了直观的收敛效果：

左图（函数曲线）：
- 一次逼近多项式和原函数\(e^x\)有明显偏差，二次逼近大幅贴合，三次逼近几乎和原函数完全重合，肉眼无法区分。
右图（误差曲线）：
- 一次逼近的最大误差接近0.3，二次逼近的最大误差降至约0.05，三次逼近的最大误差仅0.0112，逼近次数每增加一次，误差几乎下降一个数量级，收敛速度极快。

四、任意区间的通用变换方法

勒让德多项式仅在\([-1,1]\)上正交，若需要求解任意区间\([a,b]\)上的最佳平方逼近，只需通过线性变换将区间映射到\([-1,1]\)，步骤如下：

1. 区间线性变换

对\(x \in [a,b]\)，做变换：

\[x = \frac{b-a}{2} t + \frac{a+b}{2}, \quad t \in [-1,1] \]

逆变换为：

\[t = \frac{2x - a - b}{b-a} \]

2. 函数转换

令\(F(t) = f\left( \frac{b-a}{2} t + \frac{a+b}{2} \right)\)，此时\(F(t)\)是定义在\([-1,1]\)上的函数。

3. 求解与回代

对\(F(t)\)在\([-1,1]\)上用勒让德多项式求最佳平方逼近\(S_n^*(t)\)；
将逆变换\(t = \frac{2x - a - b}{b-a}\)代入\(S_n^*(t)\)，得到\([a,b]\)上的最佳平方逼近多项式：
\[S_n^*\left( \frac{2x - a - b}{b-a} \right) \]

五、勒让德正交多项式方法的核心优势

我们对比「直接用幂函数基解法方程组」和「勒让德正交基方法」，核心优势如下：

对比维度	普通幂函数基	勒让德正交基
求解方式	需要解n+1阶线性方程组，计算量大	系数独立计算，仅需n+1个积分，无需解方程组
数值稳定性	系数矩阵为希尔伯特矩阵，高度病态，n≥4时结果完全失真	对角矩阵，条件数为1，无病态问题，n取到上百仍保持稳定
系数独立性	增加逼近次数时，所有系数需要重新计算	增加高阶项时，低阶系数完全不变，无需重复计算
收敛性	受病态性影响，实际收敛性极差	光滑函数收敛速度极快，次数增加误差快速下降

这也是工程中几乎都用正交多项式求解最佳平方逼近，而不用普通幂函数基的根本原因。

六、高频易错点提醒

归一化因子不能漏：系数公式中的\(\frac{2k+1}{2}\)是勒让德多项式的归一化因子，很多同学会漏掉，导致系数完全错误；
多项式展开要合并同类项：高阶勒让德多项式含有低次项，代入后必须合并同类项，才能得到正确的幂函数形式；
分部积分符号不能错：计算内积时，定积分上下限代入要注意符号，尤其是负下限的情况；
区间变换公式不能写反：线性变换的\(x\)和\(t\)对应关系要准确，避免区间映射错误；
正交性的适用范围：勒让德多项式的正交性仅在\([-1,1]\)、权函数\(\rho(x)\equiv1\)时成立，换区间/换权函数需要用对应的正交多项式。

3.3.3 切比雪夫级数深度系统讲解

切比雪夫级数是基于切比雪夫正交多项式的广义傅里叶级数，它同时具备正交多项式最佳平方逼近的数值稳定性和近似最佳一致逼近的全局误差最优性，完美解决了普通幂函数基的病态问题、勒让德逼近最大误差偏大的痛点，是工程中函数逼近的首选实用方法。

一、前置基础：切比雪夫多项式的核心正交性

切比雪夫级数的本质是正交函数族的广义傅里叶展开，其核心是切比雪夫多项式的正交性：
切比雪夫多项式\(\{T_k(x)\}\)是区间\([-1,1]\)上带权\(\rho(x)=\frac{1}{\sqrt{1-x^2}}\)的正交多项式，满足：

\[(T_i, T_j) = \int_{-1}^1 \frac{T_i(x)T_j(x)}{\sqrt{1-x^2}} dx = \begin{cases} 0, & i \neq j \\ \pi, & i=j=0 \\ \frac{\pi}{2}, & i=j \geq 1 \end{cases} \]

其中切比雪夫多项式的三角表示为\(T_k(x) = \cos(k\arccos x)\)，即\(T_k(\cos\theta) = \cos k\theta\)，这是切比雪夫级数与傅里叶级数等价的核心基础。

二、切比雪夫级数的定义与系数公式

2.1 级数定义

对\(f(x) \in C[-1,1]\)，按切比雪夫多项式\(\{T_k(x)\}\)展开的广义傅里叶级数，称为切比雪夫级数：

\[f(x) \sim \frac{C_0^*}{2} + \sum_{k=1}^\infty C_k^* T_k(x) \tag{3.35} \]

✅ 关键说明：常数项写为\(\frac{C_0^*}{2}\)，是为了让\(k=0\)和\(k\geq1\)的系数公式完全统一，避免单独定义\(k=0\)的情况。

2.2 系数公式

根据广义傅里叶系数的通用公式\(a_k^* = \frac{(f,\varphi_k)}{(\varphi_k,\varphi_k)}\)，结合切比雪夫多项式的正交性，得到统一的系数计算公式：

\[C_k^* = \frac{2}{\pi} \int_{-1}^1 \frac{f(x)T_k(x)}{\sqrt{1-x^2}} dx, \quad k=0,1,2,\dots \]

三、切比雪夫级数与余弦傅里叶级数的等价性

通过变量替换\(x=\cos\theta\)（\(\theta \in [0,\pi]\)），可以将切比雪夫级数完全转化为标准的余弦傅里叶级数，这是切比雪夫级数最核心的技巧。

3.1 变量替换推导

切比雪夫多项式的三角表示：\(T_k(x) = T_k(\cos\theta) = \cos k\theta\)；
积分变换：\(dx = -\sin\theta d\theta\)，\(\sqrt{1-x^2} = \sin\theta\)，因此\(\frac{dx}{\sqrt{1-x^2}} = -d\theta\)，积分上下限从\(x=-1\to\theta=\pi\)、\(x=1\to\theta=0\)，负号抵消后积分区间变为\([0,\pi]\)。

代入系数公式，得到等价的傅里叶系数形式：

\[C_k^* = \frac{2}{\pi} \int_0^\pi f(\cos\theta) \cos k\theta d\theta, \quad k=0,1,2,\dots \tag{3.36} \]

此时切比雪夫级数变为：

\[f(\cos\theta) = \frac{C_0^*}{2} + \sum_{k=1}^\infty C_k^* \cos k\theta \]

这正是\(f(\cos\theta)\)在\([0,\pi]\)上的余弦傅里叶级数（偶延拓到\([-\pi,\pi]\)的标准傅里叶级数）。

3.2 等价性的核心价值

计算简化：可以直接用成熟的傅里叶级数数值方法计算切比雪夫系数，无需单独开发算法；
收敛性直接继承：傅里叶级数的所有收敛性定理可直接应用于切比雪夫级数，无需单独证明；
收敛速度快：对光滑函数，切比雪夫系数衰减速度极快，仅需低次多项式即可达到极高精度。

四、收敛性定理

根据傅里叶级数的收敛理论，切比雪夫级数有极其优秀的收敛性：

若\(f''(x)\)在\([-1,1]\)上分段连续，则\(f(x)\)的切比雪夫级数在\([-1,1]\)上一致收敛于\(f(x)\)，即：

\[f(x) = \frac{C_0^*}{2} + \sum_{k=1}^\infty C_k^* T_k(x) \]

✅ 优势对比：勒让德级数的一致收敛需要更强的光滑性条件，而切比雪夫级数仅需二阶导数分段连续，收敛条件更宽松，且能保证整个区间上的点态误差可控。

五、切比雪夫级数的核心价值：近似最佳一致逼近

5.1 部分和与余项

取切比雪夫级数的前\(n+1\)项部分和作为逼近多项式：

\[S_n^*(x) = \frac{C_0^*}{2} + \sum_{k=1}^n C_k^* T_k(x) \tag{3.37} \]

当系数衰减足够快时，余项可近似为：

\[f(x) - S_n^*(x) \approx C_{n+1}^* T_{n+1}(x) \]

5.2 切比雪夫多项式的最小最大性质

切比雪夫多项式\(T_{n+1}(x)\)有一个独一无二的性质：在所有首项系数为1的\(n+1\)次多项式中，\(T_{n+1}(x)\)在\([-1,1]\)上与零的最大偏差最小，即\(\max_{-1\leq x\leq1}|T_{n+1}(x)|=1\)，是同次多项式中最小的。

5.3 核心结论

余项的最大绝对值为：

\[\max_{-1\leq x\leq1}|f(x)-S_n^*(x)| \approx |C_{n+1}^*| \cdot \max_{-1\leq x\leq1}|T_{n+1}(x)| = |C_{n+1}^*| \]

这个最大偏差是所有同次多项式逼近中最小的，因此切比雪夫级数的部分和\(S_n^*(x)\)是\(f(x)\)在\([-1,1]\)上的近似最佳一致逼近多项式。

这是切比雪夫级数不可替代的优势：它既具备正交多项式最佳平方逼近的数值稳定性（无病态问题），又能实现全局最大误差最小化，是工程中兼顾精度、稳定性和计算效率的最优选择。

六、例题详解（例3.9）：\(f(x)=e^x\)的切比雪夫逼近

求\(f(x)=e^x\)在\([-1,1]\)上的一次、二次、三次切比雪夫逼近多项式。

步骤1：计算切比雪夫系数

系数公式为\(C_k^* = \frac{2}{\pi} \int_0^\pi e^{\cos\theta} \cos k\theta d\theta\)，该积分无初等解析解，通过数值积分方法计算得：

\[C_0^* = 2.53213195, \quad C_1^* = 1.13032132, \quad C_2^* = 0.27149579, \quad C_3^* = 0.04433750 \]

步骤2：用到的切比雪夫多项式

\[T_0(x)=1, \quad T_1(x)=x, \quad T_2(x)=2x^2-1, \quad T_3(x)=4x^3-3x \]

步骤3：构造逼近多项式，展开为幂函数形式

一次逼近多项式\(S_1^*(x)\)

\[S_1^*(x) = \frac{C_0^*}{2} + C_1^* T_1(x) = \frac{2.53213195}{2} + 1.13032132x = 1.266066 + 1.130321x \]
二次逼近多项式\(S_2^*(x)\)

\[\begin{align*} S_2^*(x) &= S_1^*(x) + C_2^* T_2(x) \\ &= 1.266066 + 1.130321x + 0.27149579(2x^2-1) \\ &= 0.994570 + 1.130321x + 0.542992x^2 \end{align*} \]
三次逼近多项式\(S_3^*(x)\)

\[\begin{align*} S_3^*(x) &= S_2^*(x) + C_3^* T_3(x) \\ &= 0.994570 + 1.130321x + 0.542992x^2 + 0.0443375(4x^3-3x) \\ &= 0.994570 + 0.997309x + 0.542992x^2 + 0.177350x^3 \end{align*} \]

步骤4：误差分析

三次切比雪夫逼近的最大误差为：

\[\| e^x - S_3^*(x) \|_\infty \approx 0.00607 \]

对比例3.8中三次勒让德逼近的最大误差\(0.0112\)，切比雪夫逼近的最大误差缩小了近一半，完美体现了其近似最佳一致逼近的优势。

七、切比雪夫逼近与勒让德逼近的核心对比

对比维度	勒让德多项式逼近	切比雪夫级数逼近
正交权函数	\(\rho(x)\equiv1\)，区间\([-1,1]\)	\(\rho(x)=\frac{1}{\sqrt{1-x^2}}\)，区间\([-1,1]\)
核心最优性	最佳平方逼近，均方误差最小	近似最佳一致逼近，全局最大误差最小
数值稳定性	无病态问题，系数独立计算	无病态问题，系数独立计算，光滑函数收敛速度更快
三次逼近\(e^x\)最大误差	约0.0112	约0.00607，误差缩小近50%
一致收敛条件	要求更高的函数光滑性	仅需二阶导数分段连续，条件更宽松
核心适用场景	关注整体均方误差的场景（有限元、信号滤波）	关注全局最大误差的场景（工业控制、数学库函数实现）

八、高频易错点提醒

常数项的\(\frac{1}{2}\)不能漏：切比雪夫级数的常数项是\(\frac{C_0^*}{2}\)，不是\(C_0^*\)，直接代入\(C_0^*\)会导致常数项翻倍，结果完全错误；
正交权函数不能忘：切比雪夫多项式的正交性带权\(\frac{1}{\sqrt{1-x^2}}\)，计算内积时必须包含该权函数，否则系数完全错误；
多项式表达式不能混淆：\(T_2(x)=2x^2-1\)、\(T_3(x)=4x^3-3x\)，不要和勒让德多项式\(P_2(x)=\frac{3x^2-1}{2}\)、\(P_3(x)=\frac{5x^3-3x}{2}\)混淆；
区间限制：切比雪夫多项式的正交性和最小最大性质仅在\([-1,1]\)上成立，任意区间\([a,b]\)需先通过线性变换\(x=\frac{b-a}{2}t+\frac{a+b}{2}\)映射到\([-1,1]\)再计算；
逼近的近似性：切比雪夫级数部分和是近似最佳一致逼近，严格最佳一致逼近需通过切比雪夫交错定理求解，切比雪夫级数是工程中最实用的近似方法。

posted on 2026-02-18 08:11 Indian_Mysore 阅读(14) 评论(0) 收藏举报

刷新页面返回顶部

昆仑山:眼中无形心中有穴之穴人合一

3.3最佳平方逼近授课

3.3 最佳平方逼近 深度系统讲解

一、问题重述：最佳平方逼近的本质

二、核心推导：从极值条件到法方程组

2.1 转化为多元函数极值问题

2.2 偏导数的详细计算

2.3 用内积简化，得到法方程组

三、核心工具：格拉姆矩阵与可逆性定理

3.1 格拉姆矩阵的定义

3.2 格拉姆矩阵可逆性定理（定理3.11）

详细证明

关键推论

四、充分性证明：法方程组的解确实是最佳逼近

4.1 证明思路

4.2 详细推导

五、最佳平方逼近的核心几何意义与误差公式

5.1 几何意义：正交投影

5.2 最佳平方逼近的误差公式

公式推导

六、经典实例：多项式最佳平方逼近与希尔伯特矩阵

6.1 问题设定

6.2 计算内积与法方程组

6.3 希尔伯特矩阵的关键问题：病态性

七、最佳平方逼近的完整求解步骤总结

八、50年教学经验总结的高频易错点

例3.7 一次最佳平方逼近多项式 完整详解

一、问题明确

1.1 已知条件

1.2 核心目标

二、完整求解步骤

步骤1：计算基函数的内积，构造格拉姆矩阵

步骤2：计算\(f(x)\)与基函数的内积\(d_0,d_1\)

1. 计算\(d_0=(f,\varphi_0)=\int_0^1 \sqrt{1+x^2} dx\)

2. 计算\(d_1=(f,\varphi_1)=\int_0^1 x\sqrt{1+x^2} dx\)

步骤3：构造并解法方程组

三、逼近误差计算

3.1 平方误差（2-范数误差）

3.2 最大误差（∞-范数误差）

四、结果分析与核心结论

4.1 图像解读

4.2 关键结论：希尔伯特矩阵的病态性

3.3.2 用正交函数族作最佳平方逼近 深度系统讲解

一、为什么要用正交函数族？核心优势

二、正交函数族最佳平方逼近的核心公式

2.1 最佳逼近系数公式

2.2 最佳平方逼近函数

2.3 平方逼近误差公式

2.4 贝塞尔不等式

2.5 广义傅里叶级数

三、核心应用：正交多项式的最佳平方逼近

3.1 勒让德多项式的核心性质

3.2 勒让德多项式的最佳平方逼近

1. 系数计算公式

2. 误差计算公式

3.3 收敛性定理

定理3.12 均方收敛定理

定理3.13 一致收敛定理

四、勒让德多项式的最优性定理

定理3.14 首一勒让德多项式的平方逼近最优性

详细证明

五、内容总结与核心优势对比

高频易错点提醒

例3.8 详解：e^x的勒让德最佳平方逼近 + 通用区间变换方法

一、问题明确与前置准备

1.1 问题描述

1.2 前置知识回顾

二、完整求解步骤

步骤1：计算\(f(x)=e^x\)与勒让德多项式的内积

1. 计算\((f,P_0)\)

2. 计算\((f,P_1)\)

3. 计算\((f,P_2)\)

4. 计算\((f,P_3)\)

步骤2：计算最佳平方逼近的系数

步骤3：构造逼近多项式，转换为幂函数形式

1. 一次最佳平方逼近多项式（n=1）

2. 二次最佳平方逼近多项式（n=2）

3. 三次最佳平方逼近多项式（n=3）

步骤4：逼近误差分析

1. 均方误差（2-范数误差）

3.3 最佳平方逼近深度系统讲解

例3.7 一次最佳平方逼近多项式完整详解

3.3.2 用正交函数族作最佳平方逼近深度系统讲解

3.3.3 切比雪夫级数深度系统讲解