之前我写过一篇博客 学习曲线,解释的还算清楚,

但是读了吴恩达的书,又有些新的体会,主要是把 学习曲线 和 偏差方差 结合起来,进行模型优化分析

 

 

 

学习曲线解读

 

那么问题来了,最优错误率从何而来?一般我们是不好确定的,故我们可以把 测试集和训练集 误差间距较小时,定为最优样本量

 

参考资料:

吴恩达:完整翻译版《机器学习要领》