随笔分类 -  机器学习

该文被密码保护。
posted @ 2018-07-25 21:10 ysyouaremyall 阅读(8) 评论(0) 推荐(0)
摘要:31.解读学习曲线:其他情况 下图反映了高方差,通过增加数据集可以改善。 下图反映了高偏差和高方差,需要找到一种方法来同时减少方差和偏差。 32.绘制学习曲线 情况:当数据集非常小时,比如只有100个样本,这时绘制出来的学习曲线可能噪声非常大。 解决方法: (1)与其只使用10个样本训练单个模型,不 阅读全文
posted @ 2018-06-15 21:32 ysyouaremyall 阅读(284) 评论(0) 推荐(0)
摘要:21.偏差和方差举例 前提:对于人类而言,可以达到近乎完美的表现(即人类去做分类是误差可以接近0)。 (1)假设算法的表现如下:训练误差率:1%,开发误差率:11%;此时即为高方差(high variance),也被称为过拟合(overfitting)。 (2)假设算法的表现如下:训练误差:15&, 阅读全文
posted @ 2018-06-14 22:06 ysyouaremyall 阅读(397) 评论(2) 推荐(0)
摘要:11.何时修改开发集、测试集和度量指标 开展一个新项目,尽快选好开发集和测试集;例子,根据度量指标A分类器排在B分类器前面,但是团队认为B分类器在实际产品上优于A分类器,这时就需要考虑修改开发集和测试集,或者评价指标了。 有三个主要原因可能导致A分类器的评分较低: (1)你需要处理实际数据的分布和开 阅读全文
posted @ 2018-06-13 22:39 ysyouaremyall 阅读(297) 评论(0) 推荐(0)
摘要:1.为什么选择机器学习策略 案例:建立猫咪图像识别app 系统的优化可以有很多的方向: (1)获取更多的数据集,即更多的图片; (2)收集更多多样数据,如处于不常见的位置的猫的图,颜色奇异的猫的照片等; (3)增加算法迭代次数,使算法训练的更久; (4)尝试添加正则化; (5)改变神经网络的架构(层 阅读全文
posted @ 2018-06-11 18:55 ysyouaremyall 阅读(371) 评论(0) 推荐(0)