美文网首页
HBase读写数据流程

HBase读写数据流程

作者: Movle | 来源:发表于2020-05-10 08:28 被阅读0次

    目录
    一.读写流程
        1.1 HBase读数据流程
        1.2 HBase写数据流程
    二. 退役(decommissioning)
        2.1第一种方案
        2.2 另一种方案
    三.Hbase集群出问题如何重置

    一、读写流程

    1.1、HBase读数据流程

    读流程

    (1).HRegionServer保存着.META.的这样一张表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面找到.META.表所在的位置信息,即找到这个.META.表在哪个HRegionServer上保存着。

    (2) 接着Client通过刚才获取到的HRegionServer的IP来访问.META.表所在的HRegionServer,从而读取到.META.,进而获取到.META.表中存放的元数据。

    (3)Client通过元数据中存储的信息,访问对应的HRegionServer,然后扫描(scan)所在HRegionServer的Memstore和Storefile来查询数据。

    (4) 最后HRegionServer把查询到的数据响应给Client。

    1.2、HBase写数据流程

    写流程

    (1) Client也是先访问zookeeper,找到-ROOT-表,进而找到.META.表,并获取.META.表信息。

    (2) 确定当前将要写入的数据所对应的RegionServer服务器和Region。

    (3) Client向该RegionServer服务器发起写入数据请求,然后RegionServer收到请求并响应。

    (4) Client先把数据写入到HLog,以防止数据丢失。

    (5) 然后将数据写入到Memstore。

    (6) 如果Hlog和Memstore均写入成功,则这条数据写入成功。在此过程中,如果Memstore达到阈值,会把Memstore中的数据flush到StoreFile中。

    (7) 当Storefile越来越多,会触发Compact合并操作,把过多的Storefile合并成一个大的Storefile。当Storefile越来越大,Region也会越来越大,达到阈值后,会触发Split操作,将Region一分为二。

    提示:因为内存空间是有限的,所以说溢写过程必定伴随着大量的小文件产生。

    二. 退役(decommissioning)

        顾名思义,就是从当前HBase集群中删除某个RegionServer,这个过程分为如下几个过程:
        在0.90.2之前,我们只能通过在要卸载的节点上执行

    1.1第一种方案

    (1)停止负载平衡器

    hbase> balance_switch false
    

    (2) 在退役节点上停止RegionServer

    [root@bigdata11 hbase-1.3.1] hbase-daemon.sh stop regionserver
    

    (3) RegionServer一旦停止,会关闭维护的所有region

    (4) Zookeeper上的该RegionServer节点消失

    (5) Master节点检测到该RegionServer下线,开启平衡器

    hbase> balance_switch true
    

    (6) 下线的RegionServer的region服务得到重新分配

        这种方法很大的一个缺点是该节点上的Region会离线很长时间。因为假如该RegionServer上有大量Region的话,因为Region的关闭是顺序执行的,第一个关闭的Region得等到和最后一个Region关闭并Assigned后一起上线。这是一个相当漫长的时间。每个Region Assigned需要4s,也就是说光Assigned就至少需要2个小时。该关闭方法比较传统,需要花费一定的时间,而且会造成部分region短暂的不可用。

    1.2另一种方案:

    (1)新方法
        自0.90.2之后,HBase添加了一个新的方法,即“graceful_stop”,只需要在HBase Master节点执行

    $ bin/graceful_stop.sh <RegionServer-hostname>
    

        该命令会自动关闭Load Balancer,然后Assigned Region,之后会将该节点关闭。除此之外,你还可以查看remove的过程,已经assigned了多少个Region,还剩多少个Region,每个Region 的Assigned耗时

    (2)开启负载平衡器

    hbase> balance_switch false
    

    三Hbase集群出问题如何重置(学习的时候)

    1.将zookeeper中的hbase结点删除
    2.删除hdfs上的hbase目录
    3.重新启动hbase

    相关文章

      网友评论

          本文标题:HBase读写数据流程

          本文链接:https://www.haomeiwen.com/subject/ivednhtx.html