Hadoop Journal Node 作用

Hadoop Journal Node 作用

作者: kane0409 | 来源:发表于2019-03-03 05:09 被阅读0次

Hadoop Journal Node 作用
hadoop集群～NameNode/Journal Node
ubuntu 下安装Docker
搭建Hadoop-HA环境
搭建Hadoop-HA + ZooKeeper环境
019 Hadoop 2.6 多节点集群设置及 Hadoop 安
大数据开发学习笔记——HA简介
contos7安装hadoop
Hadoop: 单节点配置
Hadoop安装——单机

（转https://my.oschina.net/u/189445/blog/661561）
NameNode之间共享数据（NFS 、Quorum Journal Node（用得多））

两个NameNode为了数据同步，会通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控edit log的变化，把变化应用于自己的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了。

Hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。在hadoop1时代，只有一个NameNode。如果该NameNode数据丢失或者不能工作，那么整个集群就不能恢复了。这是hadoop1中的单点问题，也是hadoop1不可靠的表现，如图1所示。hadoop2就解决了这个问题。

hadoop2.2.0（HA）中HDFS的高可靠指的是可以同时启动2个NameNode。其中一个处于工作状态，另一个处于随时待命状态。这样，当一个NameNode所在的服务器宕机时，可以在数据不丢失的情况下，手工或者自动切换到另一个NameNode提供服务。

这些NameNode之间通过共享数据，保证数据的状态一致。多个NameNode之间共享数据，可以通过Nnetwork File System或者Quorum Journal Node。前者是通过linux共享的文件系统，属于操作系统的配置；后者是hadoop自身的东西，属于软件的配置。

我们这里讲述使用Quorum Journal Node的配置方式，方式是手工切换。

集群启动时，可以同时启动2个NameNode。这些NameNode只有一个是active的，另一个属于standby状态。active状态意味着提供服务，standby状态意味着处于休眠状态，只进行数据同步，时刻准备着提供服务，如图2所示。

架构

在一个典型的HA集群中，每个NameNode是一台独立的服务器。在任一时刻，只有一个NameNode处于active状态，另一个处于standby状态。其中，active状态的NameNode负责所有的客户端操作，standby状态的NameNode处于从属地位，维护着数据状态，随时准备切换。

两个NameNode为了数据同步，会通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控edit log的变化，把变化应用于自己的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了。

为了确保快速切换，standby状态的NameNode有必要知道集群中所有数据块的位置。为了做到这点，所有的datanodes必须配置两个NameNode的地址，发送数据块位置信息和心跳给他们两个。

对于HA集群而言，确保同一时刻只有一个NameNode处于active状态是至关重要的。否则，两个NameNode的数据状态就会产生分歧，可能丢失数据，或者产生错误的结果。为了保证这点，JNs必须确保同一时刻只有一个NameNode可以向自己写数据。

硬件资源

为了部署HA集群，应该准备以下事情：

* NameNode服务器：运行NameNode的服务器应该有相同的硬件配置。

* JournalNode服务器：运行的JournalNode进程非常轻量，可以部署在其他的服务器上。注意：必须允许至少3个节点。当然可以运行更多，但是必须是奇数个，如3、5、7、9个等等。当运行N个节点时，系统可以容忍至少(N-1)/2(N至少为3)个节点失败而不影响正常运行。

在HA集群中，standby状态的NameNode可以完成checkpoint操作，因此没必要配置Secondary NameNode、CheckpointNode、BackupNode。如果真的配置了，还会报错。

注：2.*版本的HA只有两个NN，3.*以上可以配置多个NN。

相关文章

Hadoop Journal Node 作用
（转https://my.oschina.net/u/189445/blog/661561）NameNode之间共...
hadoop集群～NameNode/Journal Node
Hadoop Journal Node 作用 - 八戒_o - 开源中国社区https://my.oschina....
ubuntu 下安装Docker
hadoop@node2:~$ uname -r 4.4.0-45-generic hadoop@node2:~$...
搭建Hadoop-HA环境
前提：搭建Hadoop完全分布式环境配置node01、node02、node03、node04上的Hadoop ...
搭建Hadoop-HA + ZooKeeper环境
前提：搭建Hadoop-HA环境配置node01、node02、node03、node04上的Hadoop 在n...
019 Hadoop 2.6 多节点集群设置及 Hadoop 安
019 Hadoop 2.6 Multi Node Cluster Setup and Hadoop Instal...
大数据开发学习笔记——HA简介
单点故障---解决ha hadoop2.x之后，Cloudera提出了QJM/Qurom Journal Mana...
contos7安装hadoop
contos 7 安装 hadoop (single node 模式) 下载 hadoop 官网：http://h...
Hadoop: 单节点配置
Setting up a Single Node Cluster. 单节点配置 Hadoop 准备启动Hadoop...
Hadoop安装——单机
根据Hadoop官网文档Hadoop: Setting up a Single Node Cluster. 准备环...

网友评论

本文标题：Hadoop Journal Node 作用

本文链接：https://www.haomeiwen.com/subject/lmwuuqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Hadoop Journal Node 作用|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！