从3月份开始,陆续面了阿里,头条,美团,快手四家公司的大数据开发岗位,近20场面试面下来挺耗费脑力的,不过结果还行...[作者空间]
在大数据领域,只有深挖数据科学领域,走在学术前沿,才能在底层算法和模型方面走在前面,从而占据领先地位。 Spark...[作者空间]
当一项新技术刚出来的时候人们会非常乐观,常常以为这项技术会给人类带来巨大的变革,对此持有过高的期望,所以这项技术一...[作者空间]
(接上篇) Spark应用实例 接下来用具体实例解决一些常见的转换。 所研究的数据集是Movielens(http...[作者空间]
如今,有不少关于Spark的相关介绍,但很少有人从数据科学家的角度来解释该计算机引擎。因此,本文将试着介绍并详细阐...[作者空间]
1.hive sql >> 五星 在大多数的工作中,主要用的语言就是sql,说难不难,只要做的多了,基本就可以...[作者空间]
记录一下 ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统...[作者空间]
随着企业的发展,他们的工作流程变得更加复杂,越来越多的有着错综复杂依赖关系的工作流需要增加监控,故障排除。如果没有...[作者空间]