美文网首页
Hadoop面试题(0919)

Hadoop面试题(0919)

作者: hipeer | 来源:发表于2018-09-19 16:08 被阅读0次

1. Hadoop1.0与Hadoop2.0有哪些区别?

  • 与hadoop1.0相比hadoop2.0新增加了一个资源管理系统YARN(Yet Another Resource Negotiator),YARN的引入为集群在利用率,资源统一管理和数据共享方面带来巨大好处。
  • hadoop1.0只能够执行MapReduce应用程序,hadoop2.0不仅可以执行MapReduce应用还可以执行其他的应用程序 。

2.hive表的元数据为什么放到RDB中而不放到HDFS中?

  • HDFS适用于大规模数据存储,而元数据的数据量不是很大。
  • 如果把hive表的元数据存储到RDB上,那么使用时查询的速度就比较快。

3. Secondary NameNode是什么?有什么用?

  • Secondary NameNode 可以理解为NameNode的一个助手,它不是NameNode的备份。
    作用:
    首先看一下NameNode对元数据的操作过程。
    NameNode管理者集群所有的元数据,包括目录,文件,分块信息,日志信息等,这些元数据都被保存在镜像文件(fsimage)和编辑日志文件(editlogs)中。在NameNode工作时这些元数据会被存储到内存中(这样速度快)。每次向HDFS写文件时NameNode都会向editlogs写入日志。fsimage与editlogs合并后才会产生新的镜像文件fsimage,而且只有在Namenode重启时才会合并。这就会带来一些问题:如何存储editlogs文件?重启时editlogs文件太多就会很慢。如果NameNode宕机大量数据就会丢失。而Secondary NameNode就是为了解决上述问题。
  • 第一个作用就是备份fsimage。第二个就是定期合并editlogs和fsimage为新的fsimage。这两个过程同时进行。

4. 什么是小文件问题?如何避免

Small file issue
小文件问题就是HDFS中存放了太多小文件
避免的方法:

  • 把小文件合并成大文件
  • 把小文件存放到HBase中

相关文章

  • Hadoop面试题(0919)

    1. Hadoop1.0与Hadoop2.0有哪些区别? 与hadoop1.0相比hadoop2.0新增加了一个资...

  • 面试题汇总:Hadoop

    1.《Hadoop常见面试题》 2.《Hadoop面试45个题目及答案》 3.《一些Hadoop面试题及答案》 4...

  • Hadoop 面试题

    hadoop组成? MapReduce 计算Yarn 资源调度hdfs 数据存储Common 辅助工具 如...

  • Hadoop一天速成

    参考了若干博客,以下是我做的笔记。 参考博客: Hadoop面试题总结:https://blog.csdn.net...

  • 程序员们的福利:学习视频、技术文档、面试题三大主题(java、架

    面试题大全 技术文档书籍 学习视频 java基础 Python基础 坦克大战 大数据Hadoop 人工智能 因为整...

  • 0919

    找工作,首先要表达这份工作可以给你多少的 表明你的学习态度,我希望我能在这份工作中有所得,而不是你的得到什么,毕竟...

  • 0919

    大宝,生日快乐!

  • 0919

    #幸福是需要修出来的~每天进步1%~幸福实修11班/14蒋春燕~江苏 20170918 【幸福三朵玫瑰】 今日3朵...

  • 0919

    我男朋友真好。

  • 0919

    今天晚上去练了散打 教练也过来教了 感觉不错 还得按制饮食习惯 晚安加油 今天的六十分吧

网友评论

      本文标题:Hadoop面试题(0919)

      本文链接:https://www.haomeiwen.com/subject/uccinftx.html