1、自我介绍,项目介绍
2、hbase的读写流程
3、spark项目中发生了数据倾斜吗,什么情况下发生,现象是什么,怎么解决?
4、hdfs读写流程
5、scala中cache,persist,checkpoint是做什么的,有什么区别,持久化级别各自含义怎么存储
6、了解scala中的apply吗
7、手写spark core中的topn
8、伴生对象了解吗
9、sparkstreaming中的算子
10、updatestatebykey怎么使用,作用是什么
1、自我介绍,项目介绍
2、hbase的读写流程
3、spark项目中发生了数据倾斜吗,什么情况下发生,现象是什么,怎么解决?
4、hdfs读写流程
5、scala中cache,persist,checkpoint是做什么的,有什么区别,持久化级别各自含义怎么存储
6、了解scala中的apply吗
7、手写spark core中的topn
8、伴生对象了解吗
9、sparkstreaming中的算子
10、updatestatebykey怎么使用,作用是什么
本文标题:大数据面试1
本文链接:https://www.haomeiwen.com/subject/hlpnjftx.html
网友评论