[斯坦福大学2014机器学习教程笔记]第四章-多元线性回归的多特征量情况下的假设形式

在这节中，我们将开始讨论一种新的线性回归的版本。这是一种更为有效的形式，这种形式适用于多个变量或者多特征量的情况。

在我们之前的学习中，我们只有一个单一特征变量x（如下面例子中的房屋面积），我们希望用这个特征量来预测y（如下面例子中的房屋价格）。我们的假设就为h_θ(x)=θ₀+θ₁x。

但是，我们在很多时候我们不仅有房屋面积这一个特征来预测房屋价格，我们还会有卧室的数量、楼层的数量和房子的年龄多个特征来预测房屋价格。

我们用变量x₁、x₂、x₃、x₄来表示这里的四个特征，用y来表示预测的输出变量。

我们用n来表示特征量的数目，如这里的n=4。
我们用m来表示样本的数量。
我们用x⁽ⁱ⁾表示第i个训练样本的输入特征量。举个例子，这个例子中x⁽²⁾表示第2个训练样本的特征向量，所以x⁽²⁾表示的就是向量[1416,3,2,40]（列向量）。在这个表示方法中，2相当于一个训练集的一个索引。
我们用x_^j⁽ⁱ⁾来表示第i个训练样本中第j个特征量的值。这个例子中x₃⁽²⁾表示第2个训练样本的特征向量里面的第3个特征值，所以它的值为2。

既然我们有了多个特征量，那我们的假设形式应该写成什么样呢？

我们之前的假设形式为：h_θ(x)=θ₀+θ₁x。
现在我们的假设形式为：h_θ(x)=θ₀+θ₁x₁+θ₂x₂+θ₃x₃+θ₄x₄。假如我们有n个特征量，那么假设形式就为：h_θ(x)=θ₀+θ₁x₁+θ₂x₂+θ₃x₃+……+θ_nx_n。

接下来，我们要简化上面写出的表达方式。为了分别我们设x₀=1（这意味着对于第i个样本都有x₀⁽ⁱ⁾=1）。当然你也可以认为我们定义了一个额外的第0个特征量。在此之前我们有n个特征量（x₁，x₂，……x_n），由于我们另外定义了一个第0特征量，并且取值恒为1，所以现在有n+1个特征量。所以我们现在的特征向量X=[x₀，x₁，x₂，……x_n]（列向量），这是一个n+1维的向量。同时我们还可以把所有的参数写成一个向量，θ=[θ₀，θ₁，θ₂，……θ_n]（列向量），这也是一个n+1维的向量。

这时我们的假设形式可以写成：h_θ(x)=θ₀x₀+θ₁x₁+θ₂x₂+θ₃x₃+……+θ_nx_n。

更巧妙的是，我们可以将这个式子写成θ^TX（θ的转置乘以X）。

posted @ 2020-03-31 14:45 不爱学习的Shirley 阅读(273) 评论(0) 收藏举报

刷新页面返回顶部

不爱学习的Shirley

[斯坦福大学2014机器学习教程笔记]第四章-多元线性回归的多特征量情况下的假设形式

公告