最小二乘法

        1、前言

                a、本文主性最小二乘的标准形式，非线性最小二乘求解可以参考Newton法

             b、对于参数求解问题还有另外一种思路：RANSAC算法。它与最小二乘各有优缺点：

             --当测量值符合高斯分布（或者说测量误差符合期望为0的高斯分布），使用最小二乘比较合适，可以获得比较稳定且很高的精度。

                而当误差服从高斯分布的情况下，最小二乘法等价于极大似然估计。

             --当测量值离散性比较大，存在很多outliers，那么使用最小二乘求解就会存在很大的误差，此时使用RANSAC算法更合适。

                线性最小二乘只适用于参数模型会线性关系的情形，RANSAC则没有此限制。

            c、线性最小二乘又分为齐次线性最小二乘和非齐次线性最小二乘。

        2、非齐次方程组的最小二乘解

                a、非齐次线性最小二乘的标准形式：

                          AX = B      (1)
                 其中A、B分别为测量数据构成的矩阵与向量，X为待求参数向量。

                 这里主要针对方程数多于未知元素的情形--超定方程组。

             b、为什么要用最小二乘求解参数：

                 举例： ${a_1}{x_1}+{a_2}{x_2}+{a_3}{x_3}=b$ ，其中 $({a_1},{a_2},{a_3},b)$ 为测量已知量， $({x_1},{x_2},{x_3})$ 为待求量。

                 那么只需要三组 $({a_1},{a_2},{a_3},b)$ 就可以求出 $({x_1},{x_2},{x_3})$ 。实际情况是某次实验不止测了三组数据：

                             $\left\{\begin{array}{l} {x_1}+2{x_2}+3{x_3}=29\\ 2{x_1}+{x_2}+{x_3}=13\\ 3{x_1}+2{x_2}+4{x_3}=37\\ 2{x_1}+4{x_2}+2{x_3}=33\\ 4{x_1}+2{x_2}+{x_3}=23 \end{array}\right.$

                 如何在（1,2,3,29）（2,1,1,13）（3,2,4,37）（2,4,2,33）（4,2,1,23）这些测量数据中求出最准确的 $({x_1},{x_2},{x_3})$ ？

                 结论：当数据存在冗余，且数据噪声偏差不大的情况下适合用最小二乘求解。

             c、如何转化为最小二乘形式：

                 例1：y = ax+b，已知（x,y）求（a,b）？

                        转化为标准形式：

                            $[x,1]\left[{\begin{array}{*{20}{c}} a\\ b \end{array}}\right]=\left[y\right]$

                        带入测量数据：

                           $\left[{\begin{array}{*{20}{c}} {{x_1}}&1\\ {{x_2}}&1\\ {{x_3}}&1\\ {{x_4}}&1 \end{array}}\right]\left[{\begin{array}{*{20}{c}} a\\ b \end{array}}\right]=\left[{\begin{array}{*{20}{c}} {{y_1}}\\ {{y_2}}\\ {{y_3}}\\ {{y_4}} \end{array}}\right]$

                 例2： $y=ax+b{x^2}$ ，已知 $(x,{x^2},y)$ ，求（a,b）？

                        转化为标准形式：

                            $[x,{x^2}]\left[{\begin{array}{*{20}{c}} a\\ b \end{array}}\right]=[y]$

                        带入测量数据：



                 例3：

                           ，

                          求？？

                          转化为标准形式：

                           $\left[{\begin{array}{*{20}{c}} u\\ v \end{array}}\right]=\left[{\begin{array}{*{20}{c}} x&y&1&0&0&0\\ 0&0&0&x&y&1 \end{array}}\right]\left[{\begin{array}{*{20}{c}} {{p_1}}\\ {{p_2}}\\ {{p_3}}\\ {{p_4}}\\ {{p_5}}\\ {{p_6}} \end{array}}\right]$

                          带入测量数据：



                   总结：对于线性表达式，通过适当的变型即可，如例1。

                           在例2中，通过选取和为基实现了线性化。

                           对于非线性表达式，可以通过合适的基、变型，有时候也可以转化为标准形式，如例2、例3。

                           在例3中，对参数p矩阵选取合适的基实现了线性化。

                           即选取基：

                           $\left[{\begin{array}{*{20}{c}} 1&0&0\\ 0&0&0 \end{array}}\right]$ 、 $\left[{\begin{array}{*{20}{c}} 0&1&0\\ 0&0&0 \end{array}}\right]$ 、 $\left[{\begin{array}{*{20}{c}} 0&0&1\\ 0&0&0 \end{array}}\right]$ 、 $\left[{\begin{array}{*{20}{c}} 0&0&0\\ 1&0&0 \end{array}}\right]$ 、 $\left[{\begin{array}{*{20}{c}} 0&0&0\\ 0&1&0 \end{array}}\right]$ 、 $\left[{\begin{array}{*{20}{c}} 0&0&0\\ 0&0&1 \end{array}}\right]$

                           那么矩阵p在该组基下：

                           ${p_1}\left[{\begin{array}{*{20}{c}} 1&0&0\\ 0&0&0 \end{array}}\right]+{p_2}\left[{\begin{array}{*{20}{c}} 0&1&0\\ 0&0&0 \end{array}}\right]+{p_3}\left[{\begin{array}{*{20}{c}} 0&0&1\\ 0&0&0 \end{array}}\right]+...{p_6}\left[{\begin{array}{*{20}{c}} 0&0&0\\ 0&0&1 \end{array}}\right]$

             c、标准形式下最小二乘的求解：

                 对于（1）式，最小二乘的求解，相当于求解正规方程：

                                     ${A^T}AX={A^T}B$

                 标准形式下最小二乘解为：

                                     $X={\left({{A^T}A}\right)^{-1}}{A^T}B$

             d、证明：

                 方法1：

                     AX = B ，对于实际测量数据，(AX – B)，即残差将不为0，为了得到最准确的解，应使残差的范数最小：

                                     $E=\min||AX-B|{|^2}$

                     对E展开：

                                     $E={x^T}({A^T}A)x-2{x^T}({A^T}B)+||b|{|^2}$

                     令E的导数等于0，即可求出X:

                                     $X={\left({{A^T}A}\right)^{-1}}{A^T}B$

                 方法2：

                      根据（4）式（B - AX）所构成的向量需要垂直于A的列空间，此时距离最短，E最小：

                                     A（AX - B）= 0   （5）

                      根据（5）式：

                                     $X={\left({{A^T}A}\right)^{-1}}{A^T}B$

        3、齐次方程组的最小二乘解

                a、齐次线性最小二乘的标准形式：

                                    AX = 0   (6)

                 其中A为测量数据构成的矩阵与向量，X为待求参数向量。

                 这里主要针对方程数多于未知元素的情形--超定方程组。

                 这个模型和 $\min||AX||$ 是等价的。

             b、齐次方程组的最小二乘解的约束

                 因平凡解 X = 0不是我们感兴趣的解，因此我们主要是寻求该方程组的非零解。

                 注意，如果 X 是这个方程组的解，那么对于任何标量k，使得kX也是解，因此可以建立一个合理的约束：||X||=1的解：

                 齐次最小二乘相当于求解： $\min||AX||$     且

                                   或者求解： $\min\frac{{{\rm{||AX|}}{{\rm{|}}^2}}}{{||X|{|^2}}}$

             c、齐次方程组的最小二乘解

                 通过前面a、b两部分的说明，此时问题的标准形式为：求使||AX||最小化并满足||X|| = 1时的X。其结论为：

                                  ${A^T}A$ 最小特征值对应的特征向量即为待求解

                 证明：

                       对A矩阵SVD分解（可参加我另外一篇博客），令 $A{\rm{=}}UD{V^T}$ ，那么问题变成：

                                $\min||UD{V^T}X||$     且

                       由于： $||UD{V^T}X||=||D{V^T}X||$ ，即U矩阵不影响范数。

                       同时： $||X||=||{V^T}X||$ ，和U矩阵一样，V矩阵不影响范数。

                       那么（7）式变为：

                                $min||D{V^T}X||$      且 $||{V^T}X||=1$

                       令 ||y|| = 1，则（8）式变为：

                                       且

                       由SVD分解的规则可知，D是对角元素按降序排列的一个对角矩阵，

                       因此该问题的解是 $y={(0,0,...0,1)^T}$ ，它具有一个非零元素1并在最后的位置上。

                       $X={V^T}y$ 就是V的最后一列。

        4、加权最小二乘问题

                这是对非齐次方程组的最小二乘问题的补充。

             对于每一组测量数据，都存在（4）式所定义的误差E，当对不同的E进行加权时，便成了加权最小二乘问题。

             此时，（5）式应变为： ${A^T}C(AX-B)=0$ ，（2）应变为： $({A^T}CA)X={A^T}CB$ ，其中C为加权矩阵。

             加权最小二乘问题的解为： $X={({A^T}CA)^{-1}}{A^T}CB$

        5.1、带约束方程组的最小二乘解（1）

                如果3、齐次方程组的最小二乘模型存在约束，即：

                               $\min||AX||$     且，且

             求解思路分析：

                    对C矩阵进行SVD分解， $C=UD{V^T}$ ，如果C不是方阵，如何行数少于列数那就在C矩阵后面一行行补0。

                    如果对角矩阵D有r个非零对角元素，此时C的秩为 r 且C的行空间由的前 r 行生成，则C的行空间的正交补

                    由 ${C^\bot}$ 余下的行生成，记 ${C^\bot}$ 为的消去前 r 列得到的矩阵，则 $C{C^\bot}=0$ ，对比，可以得到：

                    X的解由 ${C^\bot}$ 的列生成，把所有满足这一条件的 X 记为： $X={C^\bot}{X^'}$ 。

                    由于 ${C^\bot}$ 的列具有正交性，因此： $|X||=||{C^\bot}{X^'}||=||{X^'}||$

                    此时，（10）变成：

                              $\min||A{C^\bot}{X^'}||$ 且 $|{X^'}||=1$

                   （10）求解算法总结：

                    a、如果C的行数少于列数，则在C矩阵的后面添加若干行0从而扩展成方阵，通过对C进行SVD分解，求出 $C=UD{V^T}$

                    b、分解的时候将非零元素排在D矩阵的前面，将矩阵V消去前 r 列（r为D矩阵对角线上非零元素个数）得到矩阵 ${C^\bot}$ 。

                    c、根据3、齐次方程组的最小二乘模型的求解方法求解（11）。

5.2、带约束方程组的最小二乘解（2）

5.3、带约束方程组的最小二乘解（3）

posted @ 2016-03-08 09:55 neu博阅读(8574) 评论(3) 收藏举报

刷新页面返回顶部