摘要: 多任务学习(Multi-task learning) 在迁移学习中,你的步骤是串行的,你从任务A里学习只是然后迁移到任务B。在多任务学习中,你是同时开始学习的,试图让单个神经网络同时做几件事情,然后希望这里每个任务都能帮到其他所有任务。 我们来看一个例子,假设你在研发无人驾驶车辆,那么你的无人驾驶车 阅读全文
posted @ 2020-02-25 13:50 刘通1997 阅读(940) 评论(0) 推荐(0)
摘要: 迁移学习 深度学习中,最强大的理念之一就是迁移学习,有的时候神经网络可以从一个任务中习得知识,并将这些知识应用到另一个独立的任务中。 所以例如,也许你已经训练好一个神经网络,能够识别像猫这样的对象,然后使用那些知识,或者部分习得的知识去帮助您更好地阅读x射线扫描图,这就是所谓的迁移学习。 具体来说, 阅读全文
posted @ 2020-02-25 13:48 刘通1997 阅读(227) 评论(0) 推荐(0)
摘要: 定位数据不匹配 (1)如果发现存在数据不匹配问题,建议做错误分析,或者看看开发集和训练集,试图找出这两个数据集分布到底有什么不同,然后看看有没有办法收集更多看起来像开发集的数据作训练。 (2)案例1:后视镜语音激活。发现在开发集中有很多汽车噪声,而训练集中没有,这就是造成分布不同的一大原因,解决办法 阅读全文
posted @ 2020-02-25 13:47 刘通1997 阅读(209) 评论(0) 推荐(0)
摘要: 不匹配数据划分的偏差和方差 存在的问题 估算学习算法的偏差和方差,真的可以帮你确定接下来应该优先做的方向。但是当你的训练集来自和开发/测试集不同分布的时候,分析偏差和方差的方式可能不一样。 训练集的误差:在得到最终的神经网络之后,将其应用到训练集的每个样本,只进行正向传播,然后得到的错误率。 如果开 阅读全文
posted @ 2020-02-25 13:46 刘通1997 阅读(350) 评论(0) 推荐(0)
摘要: 深度学习算法对训练数据的胃口很大,当你收集到足够多的带标签数据构成训练集时,算法效果最好。 这导致很多团队用尽一切方法收集数据,然后把它们堆到训练集里,让训练的数据量更大。但是有些数据,甚至是大部分数据,都来自和开发集和测试集不同的分布。所以深度学习时代,越来越多的团队都用和dev set、test 阅读全文
posted @ 2020-02-25 13:43 刘通1997 阅读(218) 评论(0) 推荐(0)
摘要: 进行误差分析(Carrying out error analysis) 你希望让学习算法能够胜任人类能做的任务,但你的学习算法还没有达到人类的表现,那么人工检查一下你的算法犯的错误也许可以让你了解接下来应该做什么。 这个过程称为错误分析,我们从一个例子开始讲吧。 假设你正在调试猫分类器,然后你取得了 阅读全文
posted @ 2020-02-25 13:42 刘通1997 阅读(409) 评论(0) 推荐(0)
摘要: 机器学习准确率与人类的比较 当一个算法表现比人类好时,性能会逐渐达到某个理论上限,这就是贝叶斯最优错误率(bayes optional error),是指理论上可以达到的最优错误率 可避免偏差 以猫分类器为例,假设人类错误率为1%,如果训练集和测试集错误率分别为8%和10%,我们会倾向与减少偏差,因 阅读全文
posted @ 2020-02-25 13:40 刘通1997 阅读(536) 评论(0) 推荐(0)
摘要: 举一个例子,假如模型是识别猫的照片并推送给用户,A的错误率为3%,B的错误率为5%。正常情况我们应该选择A模型。但是发现A会把很多色情图片分类为猫,这里显然A模型是不能接受的,这个时候我们需要改变评估指标了。我们希望新的评估指标 B的得分比A高,这样我们就可以选择B模型了。正常情况下我们在评估模型时 阅读全文
posted @ 2020-02-25 13:39 刘通1997 阅读(204) 评论(0) 推荐(0)
摘要: 当数据量较小时 训练、开发、测试集可以按照 7:3 或者 6:2:2 的比例划分,但在数据量巨大时验证集(也叫开发集dev)和测试集增加数据量对模型的提升没有太大的作用,应该让训练集有更大的数据,例如 100 万数据量时可以考虑 98 : 1: 1 或者 99:1。 开发集和测试集应该尽可能使用同一 阅读全文
posted @ 2020-02-25 13:38 刘通1997 阅读(306) 评论(0) 推荐(0)
摘要: 满足和优化指标 考虑不同的分类器会有不同的准确率和运行时间 我们可以将准确度和运行时间组合成一个整体评估指标,比如成本cost=accuracy−0.5∗runningTime 表示我们对两者中哪个更看重,当然我们也可以设定一个阈值,比如时间在100ms以下就可以只考虑准确率。当然也可能考虑假阳性, 阅读全文
posted @ 2020-02-25 13:37 刘通1997 阅读(188) 评论(0) 推荐(0)