摘要:
机器学习系统设计 确定执行的优先权(Prioritizing what to work on:Spam classification example) 问自己两个关键测试的问题: 1、当一个专家看到了这些特征量x,他能很有信心的预测出y值吗?2、我们能获得庞大的训练数据集吗,并用很多参数去训练学习算 阅读全文
摘要:
正则化(Regularization) 过拟合问题(The problem of overfitting) 欠拟合(underfitting):算法没有很好地拟合训练数据,具有高偏差(high bias)。 过拟合(overfitting):很好的拟合了数据集,具有高方差。变量太多的时候会出现,数据 阅读全文