美文网首页
6月22日第三十二次早课(hadoop)

6月22日第三十二次早课(hadoop)

作者: ly稻草 | 来源:发表于2018-06-22 17:45 被阅读0次

1.hadoop的褒义狭义

狭义指hadoop,广义指hadoop生态圈

2.hadoop三大组件,分别做什么?官网地址是什么

hdfs,mr,yarn,           hadoop.apache.org

3.hdfs的块默认大小,副本数默认多少?哪个参数控制会找吗?

128M,3

4.hdfs进程有哪些?按启动顺序

nn dn snn

5.谈谈对jps命令的理解

显示java进程信息的一个命令

6.谈谈对pid文件的理解

保存进程号的文件

7.说说你们会的hdfs哪些shell命令

  hdfs dfs -ls -mkdir -text -cat -mv -cp

8.NN,DN,SNN节点分别做什么的?

    NN存储元数据

    DN存储数据

    SNN默认一小时的冷备

9.浅谈副本放置策略

 首先就近dn,然后考虑当前机柜不同dn,再不同机架dn,最后考虑跨数据中心dn

10.(面试题)hdfs读写流程,mr提交到yarn流程  这三块,博客有没有文档了?

11.yarn的调优参数那两篇,你们博客上有没有?

12.谈谈你们对shuffle的初步理解

    预先reduce,减少reduce的复杂度

13.hive里哪种SQL会执行mr job?

    聚合,join

    insert ... as select

14.hive的元数据和数据分别存储在哪?

    mysql,hdfs

15.你们的博客有hive的 分区 作业吗?做了没

16.你们的博客有hive的 udf函数 作业吗?做了没

17.你们的博客有sqoop从MySQL抽取到hdfs或者hive作业吗?做了没

相关文章

  • 6月22日第三十二次早课(hadoop)

    1.hadoop的褒义狭义 狭义指hadoop,广义指hadoop生态圈 2.hadoop三大组件,分别做什么?官...

  • 第十一次早课

    第十一次早课: 1、hadoop的三大组件 2、hadoop官网地址 3、三大组价分别是什么 4、hadoop部署...

  • 20180613早课记录30-Hadoop

    1.hadoop是什么 狭义上说就是hdfs、mr、YARN组成的hadoop,广义上指的是整个生态圈 2.had...

  • 第十二次早课

    第十二次早课: 1、vi的三种模式 2、按哪些快捷键进入模式 3、记事本清空内容,快捷键或者命令 4、查看历史命令...

  • 第十三次早课

    第十三次早课 1、hadoop三大组件 2、我们选择了哪种模式安装 3、hdfs yarn的web界面默认端口分别...

  • 第十九次早课

    第十九次早课: 1、hadoop三大组件 2、我们选择了哪种部署模式 3、hdfs的启动进程顺序 4、NN节点要不...

  • 2021.2.11

    早课 移除身体堵塞的奎亚第三十五天 今天是除夕,早上起来的时候感觉还是很困,所以继续睡觉,一直到7点多起来才上早课...

  • 第二次早课

    早课问题及答案 第二次早课 1、vi命令的三种模式,使用什么命令切换? 2、vi命令,假如一个记事本,按什么键跳到...

  • 2021.2.14

    早课 移除身体堵塞的奎亚第三十八天 今天是大年初三,在娘家的第二天。五点多醒了,想做早课,又怕吵醒家人,担心楼板上...

  • 2017-10-31

    德培小学第三十二届家长学校第二次授课

网友评论

      本文标题:6月22日第三十二次早课(hadoop)

      本文链接:https://www.haomeiwen.com/subject/sbwhyftx.html