随笔分类 - 机器学习
摘要:31.解读学习曲线:其他情况 下图反映了高方差,通过增加数据集可以改善。 下图反映了高偏差和高方差,需要找到一种方法来同时减少方差和偏差。 32.绘制学习曲线 情况:当数据集非常小时,比如只有100个样本,这时绘制出来的学习曲线可能噪声非常大。 解决方法: (1)与其只使用10个样本训练单个模型,不
阅读全文
摘要:21.偏差和方差举例 前提:对于人类而言,可以达到近乎完美的表现(即人类去做分类是误差可以接近0)。 (1)假设算法的表现如下:训练误差率:1%,开发误差率:11%;此时即为高方差(high variance),也被称为过拟合(overfitting)。 (2)假设算法的表现如下:训练误差:15&,
阅读全文
摘要:11.何时修改开发集、测试集和度量指标 开展一个新项目,尽快选好开发集和测试集;例子,根据度量指标A分类器排在B分类器前面,但是团队认为B分类器在实际产品上优于A分类器,这时就需要考虑修改开发集和测试集,或者评价指标了。 有三个主要原因可能导致A分类器的评分较低: (1)你需要处理实际数据的分布和开
阅读全文
摘要:1.为什么选择机器学习策略 案例:建立猫咪图像识别app 系统的优化可以有很多的方向: (1)获取更多的数据集,即更多的图片; (2)收集更多多样数据,如处于不常见的位置的猫的图,颜色奇异的猫的照片等; (3)增加算法迭代次数,使算法训练的更久; (4)尝试添加正则化; (5)改变神经网络的架构(层
阅读全文

浙公网安备 33010602011771号