day2021_9_18
今日内容
-
西瓜书第二章节,几种评估方法和性能度量的几个度量名词的学习
-
评估方法有“留出法”、“交叉验证法”以及“自助法”(适合样本较小的情况)
-
交叉验证法:将数据集D分成k份大小相同的训练集/测试集。比如第一次取第一份作为测试集,其他k-1份作为
训练集,第二次取第二份作为测试集,其他k-1份作为训练集,以此类推,一直到第k次取到第k份作为测试集,其他k-1份作为训练集。
好处:所有的数据都参与了测试与训练,而且针对每一次来说,测试与训练的数据并没有相交,最后结果取均值,泛化能力较强 -
自助法适用于小样本的原因:
自助法:对一个具有m个样本的集合D进行采样,采样大小为D',随机采样m次,就可以得到m个D'大的样本,这样一直有不被采到的概率是(1-m)^m。
所以我们可以得到m个训练样本,且有约1/3的数据没在训练集中出现,可以用于测试。 -
性能度量有均方误差、错误率跟精度,后面又引入了查准率、查全率等
遇到的问题
- 最主要的还是容易遗忘,今天差不多把西瓜书第二章节看完。当时感觉还可以,结果临睡前回顾了一下还是忘了很多
明天计划
- 到网上找一些视频辅助学习,提高学习效率,还是针对西瓜书的学习。
浙公网安备 33010602011771号