机器学习之正规方程法

前言

           以下内容是个人学习之后的感悟,转载请注明出处~

 

 

正规方程法

一、函数参数向量化

         在计算机中,我们需要用同样的算法计算大量数据样本时,一般有两种方式:循环、参数向量化。

         循环~,可想而知,计算量不是一般的大,不建议。

         参数向量化的效率就高多了,把全部样本转换为向量,一次执行就搞定了。具体向量化方法,如下图所示,以线性回归

方程hθ(x)=θ01x1为例,最终转换为θ的等价公式,为正规方程法做好准备。

          

 

                                          

                                                                                                             注:X为样本矩阵,每一行为特征向量x的转置

        看到这里,相信很多童鞋的内心是崩溃的,上面这个公式是怎么来的,你倒是讲清楚啊~

        推导过程如下:

        1、这是4个样本的特征向量,每个样本的输出值hθ(x)=θTx

                

 

           2、特征向量组合成样本矩阵X

             

            3、输出值向量y=(学过矩阵论的童鞋都能看得出来这是怎么来的,我就不多说了)

                                                                  

                                                                      

                                   

                                                                

 

二、正规方程法

        直接根据上图中的θ等价公式,采用所给样本,进行矩阵运算即可。

        注意:由于矩阵的特殊性,以下三点需要谨慎对待。

  • 矩阵(XTX)不可逆

                原因1:所求参数大于样本数。

                措施  :增加样本数。

                原因2:特征值太多。

                措施  :删除一些冗余的特征值。

  • 样本量n太大

                 矩阵求逆的计算复杂度为O(n3),当样本量太大时,计算量过大,此时,不建议采用正规方程法。

  • 函数太复杂

                此时无法使用正规方程法。

 

 

以上是全部内容,如果有什么地方不对,请在下面留言,谢谢~

posted @ 2017-08-26 11:30 steed灬 阅读(...) 评论(...) 编辑 收藏