[吴恩达Coursea机器学习] 笔记005 模型定义-假设函数
符号:
$ x^{(i)} \(:输入变量,也叫输入特征 \) y^{(i)} \(:预测输出 \) (x{(i)},y) \(:第i个样本 \) (x{(i)},y; i=1,...,m) $:训练集
其中
m :训练集样本数量
X : 输入空间
Y: 输出空间
X = Y = \(\mathbb{R}\)

目标:
学习到一个“好”的假设函数 \(h_{\theta}(x)\) : X → Y
learn a function \(h_{\theta}(x)\) : X → Y so that \(h_{\theta}(x)\) is a “good” predictor for the corresponding value of y.

上面这个模型叫做线性回归模型(单变量线性回归模型,只有一个特征x)
问:怎样表示假设函数\(h_{\theta}(x)\)(Hypothesis Function)?
答: \(y = h_{\theta}(x) = \theta_0 + \theta_1x\),\(\theta_0\)是参数,\(x\)是特征(单变量)
问:为什么是线性函数?
答:因为这个最简单,先从最简单的入手。也可以是其他很复杂的函数,比如二次多项式函数
例子:
假设有下面的数据集
| \(x\) | \(y\) |
|---|---|
| 0 | 4 |
| 1 | 7 |
| 2 | 7 |
| 3 | 8 |
假设我们猜测 \(\theta_0 = 2\) 和 \(\theta_1 = 2\),从而得到 \(h_{\theta}(x) = 2 + 2x\)
问:上面猜测出来的参数值\(\theta\)是最优的吗?
答:不一定,我们只是举例猜测了一下,算法会尝试不同的θ值,最终计算出来最优的参数

浙公网安备 33010602011771号