泛化挑战:从输入空间 \(\mathcal X\) 与输出空间 \(\mathcal Y\) 的联合分布中,仅能有限采样得到训练数据集 \(\mathcal D_{\text{train}} = \{(x_i, y_i)\}_{i=1}^n\) ,目的是寻找真实映射函数 \(f^*:\mathcal{X} \to \mathcal{Y}\) ,利用归纳偏置构建一个模型 \(h \in \mathcal H\) 在未见数据集上尽可能逼近 \(f^*\) 。
归纳偏置:机器学习算法主动偏好某一类函数(先验经验——对“何种函数更可能是真实规律”的结构性假设)来约束假设空间 \(\mathcal{H}\),从无穷多拟合好训练数据集的函数空间中,选出一个具有良好泛化能力的解
没有归纳偏置,就没有泛化
浙公网安备 33010602011771号