该系列是笔者自己在阅读凌晓峰,杨强两位教授所著《学术研究你的成功之道》的读书笔记。笔者挑选适合自己的章节做笔记并且加上自己的理解,本着开放和共享的原则,分享出来,欢迎有缘人交流指正。
本文是第一篇,介绍格雷准则。
格雷准则是由图灵奖得主Jim Gary, 在1999年图灵奖颁奖典礼上提出的一个好的问题应该具备的几个条件。
1. 有明显的益处;
2. 描述简单;
3. 尚且不具备明确的解法;
4. 解决方案具备可测试性,大问题可以拆解为多个子问题,能观察到每个子问题的进程;
在上述四点之外,本书作者提出了第五个针对现在计算机领域的一个条件
5. 要确保研究中数据获取的可靠性以及足够数量;
下面分别对上述几个原则进行介绍:
关于第一点“有明显的益处”无需多言。第二点“描述简单”是和第一点有明显益处紧密相关,因为一个问题如果重要,那么描述起来多数也是简单的。测试描述简单可以用“电梯描述法”看能否在1分钟之内将问题意义清楚明白的讲出来。
关于第三点“尚不具备明确解法”:是指提出的问题要具有一定的难度,同时要新颖,一个研究问题,如果已经有了不错的解决方案,就不具备新颖性了。举例而言,有word和wps, 当下一个文字处理系统应当有了很清楚的解法,此时如果再有一个系统,哪怕效率更高,体验更好,也很难说是一个好问题,但是如果是接收大脑信号,直接产出绘图和文字的,则没有明确方案,确实是一个好的问题。
第四点,“解决方案具备可测试性,大问题可以拆解为多个子问题,能观察到每个子问题的进程”,这个标准的目的是为了让我们能够看到中间结果而不仅仅是最后结果,如果最终结果不对,也有利于查找错误。
第五点,“要确保研究中数据获取的可靠性以及足够数量” , 对于机器学习领域应该不陌生,一个好的研究,应当能够提供更好的预测能力和解释能力,足够多的优质数据能够大大增强研究结果的说服力。我自己认为除了增加研究说服力,可靠的数据本身也是算法研究的导航系统之一,如果验证集错了,评价指标也成了无源之水,根本无法确定算法改进是否真的有效。
第一点,第二点,第五点都很容易理解,可操作性最差的应该是第三点和第四点,如何判断一个问题尚且不具备明确解法以及如何进行拆解,拆解粒度如何,拆解的标准又是如何,关于这个问题的解法,请看下篇文章-棋盘法。
网友评论