大数据面试1

作者: Lzs_80b5 | 来源:发表于2018-05-28 22:09 被阅读0次

1、自我介绍,项目介绍

2、hbase的读写流程

3、spark项目中发生了数据倾斜吗,什么情况下发生,现象是什么,怎么解决?

4、hdfs读写流程

5、scala中cache,persist,checkpoint是做什么的,有什么区别,持久化级别各自含义怎么存储

6、了解scala中的apply吗

7、手写spark core中的topn

8、伴生对象了解吗

9、sparkstreaming中的算子

10、updatestatebykey怎么使用,作用是什么

相关文章

网友评论

    本文标题:大数据面试1

    本文链接:https://www.haomeiwen.com/subject/hlpnjftx.html