导航

公告

机器学习笔记（3）：多元线性回归

多元线性回归的表达

当有多个特征输入时，h(x)函数可以表示为

为了方便表示，我们假设 x₀ = 1，将特征输入和参数用向量表示如下：

则 h(x) 可以表示为;

多元线性回归中的梯度下降

当有多个特征输入时，梯度下降公式为

特征缩放(feature scaling)

当每个输入特征值的值范围相差很大时，梯度下降会很慢才能到达最小值

所以，为了加速梯度下降，我们要让每个输入特征值都在大致相同的取值范围内，如

特征缩放一般是将特征值除以值范围（如最大值与最小值之差），使得值的范围在-1和1之间

均值归一化(mean normalization)

均值归一化的公式为：

其中，μ_i为 feature(i) 的平均值，s_i为 max-min(标准偏差)

Learning Rate

调试梯度下降：做一张图，x 轴为迭代次数， y 轴为 J(θ) 的最小值，如果 J(θ) 一直增加，则需要减小 Learning Rate α

有证据证实，如果 α 足够小， J(θ) 会随着每次迭代减小

如果 α 太小，收敛会很慢；如果 α 太大，可能无法收敛

特征的选择和多项式回归

对于特征的选择，有时候我们可以将多个特征合并为一个，如，我们可以将 x₁ 和 x₂合并为新的特征 x₃= x₁ · x2

h(x) 函数不需要一定是线性的，线性可能并不能很好的 fit 所有的数据，h(x) 可以是二次方、三次方或者平方根函数

譬如如果 h_θ(x) = θ₀ + θ₁x₁ ，那么我们可以基于 x₁创建额外的特征：

二次方函数

三次方函数

平方根函数

需要注意的是，这种方式选出的特征 feature scaling 非常重要，因为二次方三次方都不在一个数量级

posted on 2018-01-04 10:57 风过蔷薇阅读(267) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部