【机器学习基础】数据集的划分比例
前言
1)如果数据集较小(传统机器学习)时,一般采用简单交叉验证的方法,即不设置验证集,而只设置训练集和测试集.
根据西瓜书的观点,训练集和测试集的比例设置一般为 2:1 ~ 4:1 。根据目前所看到的方法,大多数将比例设置为7:3。
2)数据量较大(比如万级)
没有验证集,训练集:测试集=7:3;有验证集,训练集:验证集:测试集=6:2:2;
3)在深度学习中若是数据很大(比如百万级、亿级),我们可以将训练集、验证集、测试集比例调整为98:1:1
参考
1. 机器学习 :训练集、验证集、测试集分配比例_Chris Kang的博客-CSDN博客;
完
各美其美,美美与共,不和他人作比较,不对他人有期待,不批判他人,不钻牛角尖。
心正意诚,做自己该做的事情,做自己喜欢做的事情,安静做一枚有思想的技术媛。
版权声明,转载请注明出处:https://www.cnblogs.com/happyamyhope/
心正意诚,做自己该做的事情,做自己喜欢做的事情,安静做一枚有思想的技术媛。
版权声明,转载请注明出处:https://www.cnblogs.com/happyamyhope/
浙公网安备 33010602011771号