4.4.2 模型选择
复习一下为什么我们需要训练集,验证集和测试集
对于同一种算法,有很多种超参数可以选择。在固定了一种超参数之后,我们就得到了一个具体的模型。对于这个模型,我们在训练集上进行训练,并在验证集上进行评估。在不同的超参数之间选择验证集评估分数最高的超参数,得到我们模型最终的超参数,然后再将训练集和验证集合并,放到模型上进行训练,最后得到一个参数也调整好了的模型,在输入测试集去评估这个模型的泛化误差
之所以不直接将验证集换成测试集,是因为这个样子我们无法知道我们模型真正的泛化能力。由于我们的模型的损失函数是在训练集上优化的,所以我们有可能过拟合训练集;我们的评估指标是在验证集上做出的,所以我们有可能过拟合验证集;要想真正知道我们模型的泛化能力,就必须使用测试集
书中代码全部都没有调整超参数的过程,所以书中说“书中每次实验报告的准确度都是验证集准确度,而不是测试集准确度。”

浙公网安备 33010602011771号