英文原版可以在这里找到
三遍阅读法(The Three-Pass Approach)
当我们阅读 paper 的时候,不可能对每一篇都进行完整的阅读,这太浪费时间了。因此,我们可以采用循序渐进的方法,在一篇 paper 上逐步提高我们阅读的时间,以达到时间利用性价比最大化。具体来说,我们可以将阅读分为三遍:
- 第一遍:对 paper 有大致了解
- 第二遍:掌握 paper 内容(但无需关心细节)
- 第三遍:深入理解 paper
第一遍:跳读
第一遍需要我们大致浏览 paper,对这篇 paper 有一个整体感知,进而帮助我们判断是否值得去细读这篇文章。跳读意味着我们将忽略大部分内容,可以按照如下步骤进行:
- 仔细阅读 title,abstract 和 introduction
- 阅读所有的章节标题和子标题,但忽略章节的具体内容
- 阅读 conclusion
- 看一眼 reference 里面有哪些已经读过的 paper
原作者提到还要看数学内容「Glance at the mathematical content (if any) to determine the underlying theoretical foundations」,但个人感觉具体的数学公式应该放在第二遍看。
看完后思考 5个C :
- Category(类别):属于什么类别?提出了一个 benchmark?开辟了一个新方向?还是基于已有方法的改进?
- Context(背景):和哪些 paper 是有关联的?基于什么理论基础?(判断 background 是否了解)
- Correctness(正确性):paper 的假设是合理的吗?(判断 motivation 的合理性)
- Contributions(贡献点):这篇 paper 的主要贡献点是什么?
- Clarity(清晰度):这篇 paper 的表达是否足够好,足够清晰?
完成上述内容后,基本就能够判断是否值得在这篇 paper 上面继续花时间。如果发现:
- 对 paper 不感兴趣
- 对该领域不够了解,无法理解
- 认为作者的 motivation 不够合理
则可以略过这篇 paper,无需继续在上面浪费时间。
原作者在文中提到大约5到10分钟就能完成第一遍,不过这个因人而异,刚开始无需过分求快。而且其实有时候甚至无需完整做完第一遍,看到中间发现有问题就可以early stop不继续读了。
相对而言,当我们作为一篇 paper 的作者时,需要特别关注上面提到的内容,因为如果 reviewer 在第一遍大致阅读时就觉得有问题,会大大增加 reject 的概率。
第二遍:略读
完整阅读论文的所有内容,但忽略需要深入思考的内容(例如数学证明,算法细节等)。阅读的过程中做一些简单笔记,例如不理解的术语,对某些观点的疑问等。
- 仔细阅读 paper 中的各种图表。一篇好的工作通常意味着表达完善,内容丰富的图表
- 记下 reference 中没读过的 paper,便于相关领域的后续阅读(递归式了解一个领域的好方法)
第二遍完成之后,我们大概就能向别人介绍这篇 paper 的主要 idea,包括 background,motivation,related work,method,result。
如果我们不需要关心 paper 的细节例如赶组会PPT的时候,那么完成第二遍的时候,这篇 paper 的阅读就已经完成了。
但是,或许有时在第二遍结束时,你也无法理解一篇论文。这可能是因为:
- 这对你来说是一个新的领域,有很多不熟悉的术语和简写
- 作者使用了你不理解的证明或实验技术,从而导致 paper 的大部分内容难以理解
- 这篇 paper 可能写得不好,有未经证实的断言和大量的前向参考
你的状态不好,该开摆了
你可以:
直接开摆,看不懂就不看了- 了解相关领域知识后再来看
- 坚持读第三遍(比如用了你忽略的数学结论,在精读的时候可以细看)
第三遍:精读
当需要深入理解这篇 paper,例如复现作为 baseline,或者作为自己 paper 需要利用的一个工具时,可以继续阅读第三遍。
阅读第三遍的过程中,除了关注第二遍中忽略的数学证明,算法细节等内容,还有两个重要的方法论:
- 尝试虚拟地重新实现 paper:即假设我们有和作者相同的前提(background,motivation,related work),尝试解决 paper 提出的问题。通过这种虚实结合的方式,我们可以准确识别到 paper idea 的巧妙之处(当我们想不到好的解决方案时),还可以捕捉 paper 隐藏的缺陷和假设(当我们的方法更好时)
- 在思考过程中记下对于 future work 的想法,例如想到了可以基于 paper 方法再做提升的 idea,或者从另一个角度来解决问题
原作者提到:对于初学者来说,完成第三遍大约需要四到五个小时,对于有经验的读者来说,大约需要一个小时。
在第三遍结束时,我们应该能够根据记忆梳理 paper 的完整结构,并能够指出 idea 的优缺点。除此之外,我们应该能够指出隐含的假设,相关工作的缺失引用以及实验或分析技术的潜在问题。