Oten

2024年7月11日

机器学习策略篇：详解数据分布不匹配时，偏差与方差的分析（Bias and Variance with mismatched data distributions）

摘要：详解数据分布不匹配时，偏差与方差的分析估计学习算法的偏差和方差真的可以帮确定接下来应该优先做的方向，但是，当训练集来自和开发集、测试集不同分布时，分析偏差和方差的方式可能不一样，来看为什么。继续用猫分类器为例，说人类在这个任务上能做到几乎完美，所以贝叶斯错误率或者说贝叶斯最优错误率，知道这个问题阅读全文

posted @ 2024-07-11 09:51 Oten 阅读(325) 评论(0) 推荐(1)

2024年7月10日

机器学习策略篇：详解如何使用来自不同分布的数据，进行训练和测试（Training and testing on different distributions）

摘要：如何使用来自不同分布的数据，进行训练和测试深度学习算法对训练数据的胃口很大，当收集到足够多带标签的数据构成训练集时，算法效果最好，这导致很多团队用尽一切办法收集数据，然后把它们堆到训练集里，让训练的数据量更大，即使有些数据，甚至是大部分数据都来自和开发集、测试集不同的分布。在深度学习时代，越来越多阅读全文

posted @ 2024-07-10 13:34 Oten 阅读(338) 评论(0) 推荐(0)

2024年7月9日

机器学习策略篇：快速搭建你的第一个系统，并进行迭代（Build your first system quickly, then iterate）

摘要：快速搭建的第一个系统，并进行迭代如果正在考虑建立一个新的语音识别系统，其实可以走很多方向，可以优先考虑很多事情。比如，有一些特定的技术，可以让语音识别系统对嘈杂的背景更加健壮，嘈杂的背景可能是说咖啡店的噪音，背景里有很多人在聊天，或者车辆的噪音，高速上汽车的噪音或者其他类型的噪音。有一些方法可以阅读全文

posted @ 2024-07-09 09:53 Oten 阅读(164) 评论(0) 推荐(0)

2024年6月13日

机器学习策略篇：详解清除标注错误的数据（Cleaning up Incorrectly labeled data）

摘要：清除标注错误的数据监督学习问题的数据由输入\(x\)和输出标签 \(y\) 构成，如果观察一下的数据，并发现有些输出标签 \(y\) 是错的。的数据有些标签是错的，是否值得花时间去修正这些标签呢？看看在猫分类问题中，图片是猫，\(y=1\)；不是猫，\(y=0\)。所以假设看了一些数据样本，发现阅读全文

posted @ 2024-06-13 15:04 Oten 阅读(376) 评论(0) 推荐(0)

2024年6月7日

机器学习策略篇：详解进行误差分析（Carrying out error analysis）

摘要：从一个例子开始讲吧。假设正在调试猫分类器，然后取得了90%准确率，相当于10%错误，，开发集上做到这样，这离希望的目标还有很远。也许的队员看了一下算法分类出错的例子，注意到算法将一些狗分类为猫，看看这两只狗，它们看起来是有点像猫，至少乍一看是。所以也许的队友给一个建议，如何针对狗的图片优化算法。试阅读全文

posted @ 2024-06-07 17:52 Oten 阅读(230) 评论(0) 推荐(0)

2024年6月6日

机器学习策略篇：详解如何改善你的模型的表现（Improving your model performance）

摘要：如何改善模型的表现学过正交化，如何设立开发集和测试集，用人类水平错误率来估计贝叶斯错误率以及如何估计可避免偏差和方差。现在把它们全部组合起来写成一套指导方针，如何提高学习算法性能的指导方针。所以想要让一个监督学习算法达到实用，基本上希望或者假设可以完成两件事情。首先，的算法对训练集的拟合很好，这阅读全文

posted @ 2024-06-06 10:47 Oten 阅读(203) 评论(0) 推荐(0)

2024年5月31日

机器学习策略篇：详解超过人的表现（Surpassing human- level performance）

摘要：超过人的表现讨论过机器学习进展，会在接近或者超越人类水平的时候变得越来越慢。举例谈谈为什么会这样。假设有一个问题，一组人类专家充分讨论辩论之后，达到0.5%的错误率，单个人类专家错误率是1%，然后训练出来的算法有0.6%的训练错误率，0.8%的开发错误率。所以在这种情况下，可避免偏差是多少？这个阅读全文

posted @ 2024-05-31 09:40 Oten 阅读(107) 评论(0) 推荐(0)

2024年5月30日

机器学习策略篇：详解理解人的表现（Understanding human-level performance）

摘要：理解人的表现人类水平表现这个词在论文里经常随意使用，但现在告诉这个词更准确的定义，特别是使用人类水平表现这个词的定义，可以帮助推动机器学习项目的进展。还记得上个博客中，用过这个词“人类水平错误率”用来估计贝叶斯误差，那就是理论最低的错误率，任何函数不管是现在还是将来，能够到达的最低值。先记住这点，阅读全文

posted @ 2024-05-30 09:52 Oten 阅读(122) 评论(0) 推荐(0)

2024年5月29日

机器学习策略篇：详解可避免偏差（Avoidable bias）

摘要：可避免偏差如果希望学习算法能在训练集上表现良好，但有时实际上并不想做得太好。得知道人类水平的表现是怎样的，可以确切告诉算法在训练集上的表现到底应该有多好，或者有多不好，让我说明是什么意思吧。经常使用猫分类器来做例子，比如人类具有近乎完美的准确度，所以人类水平的错误是1%。在这种情况下，如果您的学阅读全文

posted @ 2024-05-29 14:05 Oten 阅读(124) 评论(0) 推荐(0)

2024年5月14日

机器学习策略篇：详解为什么是人的表现？（Why human-level performance?）

摘要：为什么是人的表现？在过去的几年里，更多的机器学习团队一直在讨论如何比较机器学习系统和人类的表现，为什么呢？认为有两个主要原因，首先是因为深度学习系统的进步，机器学习算法突然变得更好了。在许多机器学习的应用领域已经开始见到算法已经可以威胁到人类的表现了。其次，事实证明，当试图让机器做人类能做的事情阅读全文

posted @ 2024-05-14 09:46 Oten 阅读(144) 评论(0) 推荐(0)

公告