想要接触人工智能吗?先要学会如何阅读论文

凭借着对算法和AI的向往,终于有机会接触到人工智能的领域。现在的主要工作就是在OCR文字识别,期间也看了不少的论文,从CTPN到Faster RCNN,再到EAST和FOTS。最开始因为刚接触这个领域,很多名词看不懂,论文阅读非常吃力,后来随着知识的积累和深入,现在阅读也变得轻松起来。最近关注爱可可老师的微博,刚好发现了这篇文章——《How to Read a Paper》,感觉非常适合我这种英语不好、但是又需要阅读论文的人。

本文就结合最近几个月阅读论文采的坑与《How to Read a Paper》结合,摸索一下大佬们的阅读方法。

一般的机器学习工程师或者深度学习工程师,都要阅读大量的论文积累相关的领域知识。但是阅读论文本身却很少有人能传授一些经验,这篇文章提出了一种“三步法(three-pass method)”的方法,下面就来介绍一下。

背景

通常会有很多原因需要阅读论文,比如回顾某个会议或者课程、对某个领域持续的关注、开拓新的领域等等。一个专业的学术研究员或者AI研究员可能需要花费几百个小时来阅读论文,因此高效的阅读论文,是一种必不可少的经验和技能。对于刚开始阅读论文的人来说,需要经过不断的尝试和犯错,才能总结出经验和教训。作者凭借多年的阅读经验,总结出了阅读论文的“三步法”,下面就来看看到底是如何操作的吧。

三步法

阅读论文最笨拙的方法就是从头读到尾,有的时候浪费了大量的时间还不知道作者到底说了什么。如果采用三步法,一般是这么个流程:

  • 第一步,对论文的主题,对论文的核心内容有一定的了解
  • 第二步,了解论文的核心思想
  • 第三步,深入理解论文、尝试复现

第一步

通过快速的浏览论文,对论文有一个整体的了解,然后决定是否有必要继续深入阅读。这个阶段大概花费5-10分钟,主要会做下面的事情:

  • 1 仔细阅读标题、摘要和介绍
  • 2 粗略的阅读小节部分
  • 3 浏览一下数学公式,对基本的理论有一定的把握
  • 4 阅读结论
  • 5 浏览相关引用,剔除读过的文章

通过这个阶段,检查一下自己能否回答下面几个问题:

  • 1 分类方面:这篇文章属于那种类型?这篇文章的结论是通过什么指标衡量的?是否有现成的系统参考?是否有基础的模型理论参考?
  • 2 内容方面:其他的论文有没有跟这个类似的?这篇论文有没有什么参考的核心理论?
  • 3 准确性方面:这篇论文的结论可信吗?
  • 4 贡献度方面:这篇论文有什么新的想法?
  • 5 清晰度方面:这篇论文写得好吗?容易理解吗?

通过上面的信息,你就可以决定是否要继续深入下去了。如果这篇文章你压根不感兴趣,或者你暂时还不能理解它,又或者认为作者的结论是错误的,那就没必要继续阅读了。也可以把它暂时放在一边,过一段时间再来考虑要不要继续阅读。

另外,如果你也许要写论文,那么通过这个部分你应该也能了解到哪一部分是最重要的。首先一定要保证标题和副标题的连贯性、摘要的清晰程度,不然阅读者很有可能阅读完摘要、扫过标题后,就放弃阅读了。

第二步

在第二步中,需要阅读的更仔细点,但是可以把论证的部分给去掉。在阅读的时候可以划重点、抓关键词进行标记,也可以把阅读时不理解的地方记下来。这样再次阅读的时候就可以多注意和思考这些问题,自己写论文的时候也会更注意到类似的点。

  • 1 仔细的阅读论文中的图片、表格以及其他说明,尤其是要注意图片,标注的信息是否正确?有没有标错?可信么?如果发现错误,那么这篇文章很有可能不是什么好文章。
  • 2 标记那些引用的还没阅读的论文,这样可以通过一篇论文在领域内引申开,扩大对领域知识的了解。

第二个阶段大概需要花费一个小时的时间来仔细阅读,通过这个步骤就可以抓住论文的核心内容了。你可以尝试总结一下论文的主要内容、支撑的论点等等。

有时经过这个阶段还是对论文不理解,这有可能是因为刚刚接触这个领域,对于很多的概念和新名词都不了解,或者作者使用的一些论点论据难以理解,也可能是作者对于一些关键点没有描述清楚。那么你可以选择:

  • 1 把这篇论文先放在一边,希望你自己的工作或者科研不会用到相关的内容
  • 2 先阅读一下相关的背景资料引用论文,再回来看看
  • 3 尝试进行第三个步骤

第三步

为了更好的了解论文中的内容,最关键的就是第三步了,这一步需要读者尝试复现论文。假设你现在有了跟作者一样的思路,那么如何来复现它?通过复现的过程,就能轻松的理解文章的核心点,并且发现一些隐藏的坑和结论。

这一步就需要更加关注论文的细节了,需要理解和挑战论文中的每一个结论,甚至你可以自己想想有没有其他的思路。通过这种方式,就可以把一些虚拟的经验变成自己的真实经验了。对于现在这个开放的互联网时代,最简单的办法就是去github里面搜搜有没有现成的代码,直接阅读别人公开的源码。

这个步骤可能会花费几个小时、几天甚至几个月。经过这个阶段,你可以轻松的在脑海中重现整个论文的思路和结构,你也能抓住论文隐藏的结论,论文之外的工作,实验过程中潜在的问题以及分析的方法。

最后

阅读论文总的来说还是一个经验活,最起码需要有几十篇的阅读量,才能进入一个陌生的领域。通过这个“三步法”,你可以快速的判断这篇论文是否值得深入阅读,是否是你感兴趣的话题。

对于如何扩展知识、怎么筛选论文,可以通过下面的方法。

  • 首先需要一个学术性的搜索引擎,比如Google学术、CiteSeer,输入3-5个关键词进行搜索。
  • 然后通过快速通读论文,了解论文的相关工作。
  • 接下来,可以通过搜索作者的明细,查找他的其他文章,加入阅读列表中。
  • 查看关键作者最近的发表以及相关的顶级会议,一般能发表到顶级会议的论文都属于质量很高的论文。
  • 最后关注顶级会议最近的录入论文,快速浏览相关的内容,能帮你了解相关领域的发展情况。

希望读者都能在自己感兴趣的领域快速积累起来,未来也会持续的关注爱可可老师的微博,真的很有用!

参考

How to Read a Paper
爱可可老师的微博

posted @ 2018-12-22 17:15 xingoo 阅读(...) 评论(...) 编辑 收藏