如何构建能帮助你获得工作的机器学习项目

如何构建能帮助你获得工作的机器学习项目

原文:towardsdatascience.com/the-machine-learning-projects-employers-want-to-see/

如果你试图进入机器学习领域,那么做模板化项目和遵循基本教程就像试图在卡丁车上赢得一级方程式比赛。

你可能会移动,但不会竞争,更不会获胜。

我已经审查了数百个机器学习组合,并面试了数十位真实数据科学和机器学习角色的候选人,我可以告诉你:被雇佣的人构建的项目超越了教程。

因此,在这篇文章中,我将具体介绍那些能真正获得面试和工作邀请的项目和框架。

它们并不容易。

但这正是它们之所以有效的原因。

重新实现一篇研究论文

想想看。

机器学习研究论文是领域内一些领先实践者数月工作的结晶,总结在几页文字中。

这些论文中的知识量是巨大的。

因此,如果你自己分解、剖析并重新实现这些论文,想象你会学到多少。

这有点像试图根据蓝图重建一辆一级方程式赛车——你可能没有原始工程师那样的工具,但通过理解每一个螺母和螺栓,你就能学会整个机器是如何运作的。当你最终让你的版本运行起来时,你将理解赛车运动,这是大多数人从未达到的水平。

重新实现一篇论文将教会你许多技能:

  • 能够理解与前沿模型相关的复杂数学。

  • 能够从头开始使用代码或简单的库实现复杂模型。

  • 能够具有创造性思维并将自己的知识应用于新想法。

而且重要的是,大多数,我指的是近 99%,的候选人都没有这样做,所以你将立刻脱颖而出。

然而,这并不容易,我可以从亲身经历中告诉你。但容易的现在不会让你得到雇佣。

现在,你如何实现这篇论文可能是一整篇文章的主题,但让我带你了解关键步骤:

  1. 阅读论文。然后,重新阅读它,再次,再次,直到你完全理解论文试图解决的问题、使用的算法、数据以及结果为什么是显著的,以及它们是令人震惊的还是预期的。根据你的经验,这可能会花费一些时间。

  2. 如果你不懂某些概念,就去学习它们。这不是浪费时间,因为你正在积极关闭你拥有的知识差距。

  3. 绘制/编写高级架构,如输入和输出,整个系统的粗略设计和机器学习模型的结构。

  4. 从最简单的部分开始实现,并让它工作。

  5. 构建一个粗糙的工作原型。

  6. 优化并尝试复制结果。

一些我推荐的实现论文:

这些主要在深度学习领域,但你也可以找到与你想要研究的领域相关的论文。

一些有用的网站来查找论文:

解决你自己的问题

“我应该构建什么项目”?

这是我被问到的第二个最常见的问题,第一个问题是我是如何变得如此帅气的!

问题是,大多数人并不理解提出的问题本身就是错误的(项目问题,而不是帅气的问题)。

如果我给你一个具体的项目去做,那么面试中就没有故事可讲了。

你打算说什么?

“哦,某个网上的家伙说我应该构建它”

这并不是一个很好的场景。

一个能脱颖而出的项目对你来说非常个人化,你被激励去解决它。这更好、更有趣,而且会在面试中表现出来。

示例项目

让我给你举一个优秀项目的例子。

我在之前的帖子中提到了这个故事,但我要重复一遍,以真正强调你应该构建的项目类型。

在我之前的公司,我们正在招聘一名初级数据科学家,负责解决运筹学问题。

我们最终雇佣的候选人有一个突出的项目,这个项目与工作直接相关,是他们感兴趣解决的问题。

他们对幻想足球(NFL)感兴趣,并设计了自己的优化算法,以更好地分配他们每周的球员选择。

他们甚至更进一步,阅读了关于他人解决方案的期刊论文,并实施了一些想法。查看包含研究论文的链接!

我的框架

这里有一个简单的框架,供你参考,以构建与我刚才提到的类似的项目。

  1. 列出至少五个你工作之外感兴趣的事物。

  2. 对于每个主题,写下你感兴趣回答或解决的问题的五个问题。所以,总共将有 25 个潜在的问题。

  3. 现在,想想机器学习如何帮助回答这些问题。如果问题看起来完全不可能,不要担心;要有创意。然而,显然,不要尝试创造机器人狗或其他东西!

  4. 最后,选择一个你最感兴趣的问题。理想情况下,选择一个感觉稍微超出你能力范围的问题;这样,你才能真正学习和挑战自己,走出舒适区。

这个练习需要 10 分钟,所以你没有借口不做它,并且会给你一个帮助你找到工作的项目想法。

构建复杂性和规模

然而,仅仅一个想法本身可能并不足够。为此,项目需要一些复杂性和规模。

这可以通过不同的方式展示和表达。

  • 你可以使用生产代码、云系统如 AWS,以及使用DockerKubernetes来部署整个项目。

  • 你可以使用一个非常复杂、最先进的算法或框架。阅读研究论文对此非常有帮助!

  • 你可以使其用户能够与项目互动,就像一个在线应用程序。

  • 你可以使其解决各种问题,就像一套模型。

选项很多,很容易感到不知所措。

开始学习,边走边学。这就是你需要做的全部。

其他想法

如果出于某种原因,你不喜欢做上面提到的两个,尽管它们实际上会帮你找到工作,这里有一份进一步的项目想法列表。

  • 向 AI 请求一个项目;当然,给出一个合适的提示。

  • 参加 Kaggle 竞赛,但你需要取得好成绩才能脱颖而出。

  • 使用 AI/基础模型来解决个人问题。

  • 从头开始使用基本的 Numpy 编写机器学习算法,或者更好的是,仅使用原生 Python。

现在,如果你想让我进一步引导你,这是一份更具体的项目尝试列表:

  • 为 Pac-Man 或其他任何游戏进行强化学习。

  • 从头开始构建语言模型。

  • 用于对任何实际图像进行分类的计算机视觉模型。

  • 对社交媒体平台上特定主题的情感分析。

  • 为你喜欢的应用程序构建推荐系统。

  • 为特定用例微调 LLM。

再次,我提供的是高级概念,因为这些概念需要对你个人而言具有独特性才能真正脱颖而出。


在你构建了这些项目之后,你就可以开始申请工作了!

但要真正获得面试机会,你需要一份坚如磐石的简历。

那么,是什么让一份被忽视的简历和一份引起注意的简历之间有区别呢?

在下面的我之前的帖子中找到答案。

如何定制简历,让我获得了 10 万美元以上的数据科学和机器学习报价

另一件事!

我提供一对一的辅导电话,我们可以聊任何你需要的事情——无论是项目、职业建议,还是只是确定你的下一步。我在这里帮助你前进!

https://topmate.io/egorhowell

与我联系

posted @ 2026-03-28 09:24  绝不原创的飞龙  阅读(1)  评论(0)    收藏  举报