11.10

我的答案: C:泛化误差小;

我的答案: A:训练误差很小，泛化性能差;

二. 简答题（共1题，20分）

: 一、留出法
优点： 1. 相对简单直观，容易实现。 2. 计算开销较小，在数据量较大时执行速度较快。缺点： 1. 若划分不当，可能会导致训练集和测试集的数据分布差异较大，影响评估结果的准确性。 2. 只进行了一次划分，评估结果可能具有较大的随机性，不够稳定可靠。二、交叉验证法优点： 1. 能够充分利用数据，通过多次划分和训练评估，使得评估结果更加稳定可靠。 2. 可以有效地评估模型在不同数据划分下的性能表现，减少因数据划分不合理带来的偏差。缺点： 1. 计算开销较大，尤其是在数据量较大、k 值较大时，计算时间会显著增加。 2. 当数据集非常不平衡时，可能会出现某些划分中某些类别数据过少的情况，影响评估结果。三、自助法优点： 1. 在数据集较小、难以有效划分训练集和测试集时非常有用，能从有限的数据中尽可能多地进行评估。 2. 可以产生多个不同的训练集和测试集，增加了评估的多样性。缺点： 1. 会改变原始数据的分布，引入估计偏差。 2. 计算过程相对复杂，不太直观。

我的答案: ABC:测试集应该尽可能与训练集互斥; 训练集和测试集的划分要尽可能保持数据分布一致（分层采样）; 一般采用多次重复试验;

posted @ 2025-01-02 15:46 jais 阅读(60) 评论(0) 收藏举报

刷新页面返回顶部