NTU ML2023Spring Part2.2 新手村攻略

License: CC BY-NC-SA 4.0

	loss (test) large	loss (test) small
loss (train) large	可能是 optimization 不够或模型不够复杂	运气好
loss (train) small	overfitting 或 mismatch	理想状态

overfitting：需要做 data augmentation 或模型过于复杂

mismatch：训练集和测试集的数据分布不一样

关于模型不够复杂或过于复杂：把训练集分一部分作为 validation set（相当于预测试？）

如何判断一个模型 loss 高的原因是不够复杂还是 optimization 不给力？

overfitting 了怎么办？

为什么作业的评价要分 public testing set 和 private testing set？

其实可以类比成 OI 中的 pretest 和 system test，如果没有 system test 想必会有一堆乱搞过题，而且过了就是过了，没有后顾之忧。

与之对应地，尽量少地去根据 public testing set 的结果来修改模型，否则可能在 private testing set 里炸掉。（但是我前几个作业都是这么干的）

posted @ 2025-02-03 11:43 383494 阅读(7) 评论(0) 收藏举报

刷新页面返回顶部

x383494