kaggle是一个数据分析(data analysis)、数据挖掘(data mining)、机器学习(machine learning)、深度学习(deep learning)竞赛的平台。和国内阿里云举办的天池赛一样,但是它是全英文的,所以玩kaggle既可以学技术,又可以学英文啦。
打过王者荣耀的人都知道段位。kaggle上也有类似级别(tier)的说法。
只要注册一个账号,你就是一个Novice,菜鸟级别。会给你一个徽章,就像下面一样。

kaggle是一个很好的社区,在这里,你可以和全球搞数据很厉害的高手一起交流学习组队比赛。要想成为一个贡献者(contributor tier),按照下面图片所示,一项一项完成,社区就会自动给你一个4个圈圈的蓝色徽章了。增加bio个人经历,地点,职业,组织公司,验证账号(一般邮箱就可以),运行一个脚本(一般上都是用Python或者R语言写的,所以想玩kaggle基础的Python和R知识是必须的,但是竞赛还需要更高级的技能Numpy、pandas等等,数据可视化matplotlib、seaborn等等数据挖掘全家桶),都是套路,这些三方库功能很强大,上手很简单,和Python基本的数据结构list,dict、tuple、set类似,如果没接触过这些全家桶,建议先学一下Python基础数据结构,很快,一下午就能学会。

和职业体育或者职业电竞一样,kaggle上也有金、银、铜牌奖项设置,当然也有丰厚的奖金。有一点不同,职业比赛,奖牌都是唯一的。kaggle不一样,参赛者(队伍)可能有很多,几千个或者上万支,为了让大家参赛更积极,它有一个规则,最后的荣誉和奖金归属有一个百分比划分,比如,所有参赛者的前1%是金牌获得者,2%至5%是银牌获得者,等等。下面是一个要成为专家tier所需的条件。第一,参加过比赛,或者2块铜牌;2.写过kernel,或者5块铜牌。kernel的概念是一个用Python notebook写的数据分析案例,有图,有代码,有文字说明解释。讨论项要获得50个铜牌。

打怪升级,在满足下面的条件以后,你就可以成为大师了!

社区最高的级别是grandmaster,大满贯冠军。

新手建议玩一玩泰坦尼克生存预测以及手写数字识别。第一个是挖掘新闻来预测股票走势,奖金这么丰厚,还要什么自行车啊,赶紧滴。

网友评论