一: 看一个技术火不火,直接看github 上,该技术的fork,commit ,watch等指标
比如Spark 和 Hadoop 对比如下,显然目前Spark才是大数据时代的新星!
![Uploading QQ截图20160912221742_879143.png . . .]QQ截图20160912221742.png
二: 通过 JIRA 提交问题,以及查看目前存在的问题,了解最新的可以研究的问题。
比如下面是我提交的一个问题:
https://issues.apache.org/jira/browse/SPARK-17447
Spark core 中 Parttitioner.defaultPartitioner 存在问题
三: 通过github 提交代码:
具体可以参考:
http://www.parallellabs.com/2014/08/05/how-to-contribute-to-spark-step-by-step/
下面是我解决的一个问题:https://github.com/apache/spark/pull/15039
网友评论