美文网首页
hadoop-ha高可用

hadoop-ha高可用

作者: AlexDawson | 来源:发表于2019-05-14 19:52 被阅读0次

一、完全分布式存在的问题

NameNode单点故障,难以应用于在线场景

NameNode压力过大,且内存受限,影响系统扩展性

二、高可用结构图


三、图例详解

1、JN实现主备NN 间的数据共享(解决单点故障)

主NameNode对外提供服务,备NameNode同步主NameNode元数据,以待切换,所有DataNode同时向两个NameNode汇报数据块信息(位置)

standby:备用namenode,完成了edits.log文件的合并产生新的fsimage,推送回ActiveNN

2、基于Zookeeper自动切换方案

ZooKeeper Failover Controller(zkfc):监控NameNode健康状态,并向Zookeeper注册NameNode,当主NameNode挂掉后,ZKFC(备)为NameNode竞争锁,获得ZKFC(备)锁的NameNode(备)变为active。

3、ZKFC的作用

健康检测:zkfc会周期性的向它监控的namenode(只有namenode才有zkfc进程,并且每个namenode各一个)发生健康探测命令,从而鉴定某个namenode是否处于正常工作状态,如果机器宕机,心跳失败,那么zkfc就会标记它处于不健康的状态;

会话管理:如果namenode是健康的,zkfc机会保持在zookeeper中保持一个打开的会话,如果namenode是active状态的,那么zkfc还会在zookeeper中占有一个类型为短暂类型的znode,当这个namenode挂掉时,这个znode将会被删除,然后备用的namenode得到这把锁,升级为主的namenode,同时标记状态为active,当宕机的namenode,重新启动,他会再次注册zookeeper,发现已经有znode了,就自动变为standby状态,如此往复循环,保证高可靠性,但是目前仅支持最多配置两个namenode.

master选举:如上所述,通过在zookeeper中维持一个短暂类型的znode,来实现抢占式的锁机制,从而判断哪个namenode为active状态。

相关文章

  • HA机制

    一. 概念 所谓HA,即高可用(7*24小时不中断服务) 实现高可用最关键的是消除单点故障 hadoop-ha严格...

  • Hadoop-HA高可用集群QJM搭建

    1.此教程默认已经搭建好完全分布式 2. Zookeeper 集群搭建 3.HA 集群搭建 首先声明 笔者用的6台...

  • hadoop-ha完全分布式高可用

    机器配置: 10.33.101.243 master 10.33.101.244 slave01 10.33.10...

  • 架构(4),高可用

    高可用包括:存储高可用,计算高可用,业务高可用。 一、存储高可用 存储的高可用,主要是通过数据冗余的方式来实现高可...

  • day46 高可用(keepalived)

    高可用的基本概述vrrp的原理高可用核心概念总结keepalived高可用安装与配置keepalived高可用抢占...

  • 高可用性

    高可用性概述 什么是高可用性 高可用性 = 高 + 可用性。可用性(Availability)表示系统能在客户需要...

  • Hadoop 系列(八)—— 基于 ZooKeeper 搭建 H

    一、高可用简介 Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN ...

  • 综合架构之keepalived(高可用)

    内容涉及 高可用原理高可用配置文件高可用服务常见问题实现高可用服务双主功能 keepalivd----------...

  • LVS+KeepAlived高可用部署实战应用

    LVS+KeepAlived高可用部署实战 1. 构建高可用集群 1.1 什么是高可用集群 1.2 高可用衡量标准...

  • Linux学习-MySQL-week05

    MySQL高可用及读写分离 为什么要使用高可用 ? 什么是高可用?企业高可用标准:全年无故障时间无故障时间 ...

网友评论

      本文标题:hadoop-ha高可用

      本文链接:https://www.haomeiwen.com/subject/qipmaqtx.html