为什么要阅读论文?
阅读机器学习论文是算法工程师技术精进的不可缺少的学习途径。虽然实际工作使用的机器学习算法很多已经出现了十几年了,但是将机器学习技术应用于实际互联网项目开发中却只是最近几年的事情,而且这几年随着深度学习的流行,基于深度学习的机器学习项目也开始在国内外大型互联网公司逐渐应用并取得了一定的效果,而学习这些成果项目实践的最快方法就是阅读这些公司发布在各大著名会议上的论文,所以作为一名有技术追求的算法工程师必须阅读相应的论文拓宽思路和提高技术能力。
一篇论文的基本结构?
通常一篇论文有如下几个部分组成:
- Abstract:论文的摘要,该部分通常要交代发表论文的应用场景、目前方法的不足进而引出该论文提出的新的方法改进与创新点。
- Categories and Subject Descriptors:论文的研究领域分类与课题描述词,例如信息处理与存取。
- Keywords:论文内容的一些关键词。
- Introduction:论文的主要内容介绍,这部分内容相对摘要更为详实。一篇来自互联网公司一线的实践项目论文介绍通常包含了该论文尝试解决的问题以及该问题的现状,然后是描述该论文在相应公司的应用场景,并给出相应的解决方案或者基于已有方案的创新改进,另外还包括该论文实际的工程架构、AB测试方法和实际的应用效果介绍。
- 主要内容:接下来就是论文的主要内容详细阐述了。
- Conclusion:论文的总结。该部分通常会再次将论文主要内容和创新点进行概要总结,给出该论文达到的实际应用成果,以及该论文能够解决的扩展领域的相关问题。
- References:论文的引用。一篇论文通常都会引用几十篇相关论文,主要包括该论文试图解决问题的领域介绍、前人已经发布的研究方法等。
如何阅读一篇论文?
关于如何阅读一篇论文,本人根据自己的论文阅读经验给出如下几点建议供参考:
要不要精读?
先看下论文Abstract部分,细读Abstract的内容确保论文的内容是与你的期望要看到的东西是相符的,如果该内容和你预想的完全不一样,基本可以判断你找错论文了,不用浪费时间再读下去了;
接着看下论文的研究领域和关键词是不是与你工作的领域相符,接着就是论文的介绍部分了,可以重点看下论文的创新点是什么,比如找下a novel way这样的句词,如果这里说的是你感兴趣的内容你就可以精读这篇论文了。
怎么精读?
个人觉得一篇内容详实的内容不读个好几遍是吃不透的,通常第一遍先匆匆过一遍,碰到相应的英文生词不影响理解内容就先略过(多读几篇同一领域的论文后生词就很少了),然后第二遍重点选读论文的核心内容:比如数学公式的推导、伪代码实现,建议这时候要拿出笔把里面的公式抄抄画画,重点部分内容圈圈,加点备注方便后面复读和加深理解,第二遍阅读通常要花很长时间,如果在工作之余时间的话,个人通常要花费好几个小时,碰到实在不理解的内容可以问问同事,也许同事已经读过这篇论文,或者知乎上搜下,业内比较经典的论文知乎都有牛人做过阅读分享,可以参考阅读,不过本人建议还是自己先折腾一遍再看下别人的分享会更好,至少先对论文的内容比较熟悉了再去看,这就像学习的时候碰到难题不能直接去看参考答案啊,经过这一翻折腾后,应该已经对论文内容已经消化的差不多了,最后也是个人认为最重要的一点就是如果这篇论文是一篇实践性很强的论文,例如谷歌的那篇经典的点击率预估论文:(https://research.google.com/pubs/archive/41159.pdf),论文给出了伪代码,强烈建议自己用现成的数据(网上公开的或自己项目中的数据)用代码实现一遍,即使自己觉得独立实现不了,也建议参考别人的代码敲一遍,绝对收获巨大!!!,最后还有可以将自己的论文阅读理解用博客写出来或在公司内部分享,把这些内容写出来或说出来,也会大大加深对论文的理解。
网友评论