HBase读写数据流程

作者: Movle | 来源:发表于2020-05-10 08:28 被阅读0次

HBase读写数据流程
HBase读写数据分几步？具体是怎样操作的？
HBase读写数据流程
HBase读写流程
Hbase读写流程
Hbase读写流程
hbase读写流程
Hbase读写流程
Hbase读流程解析
Python 读写 hbase 数据的正确姿势（一）

目录
一.读写流程
    1.1 HBase读数据流程
    1.2 HBase写数据流程
二. 退役(decommissioning)
    2.1第一种方案
    2.2 另一种方案
三.Hbase集群出问题如何重置

一、读写流程

1.1、HBase读数据流程

读流程

(1).HRegionServer保存着.META.的这样一张表以及表数据，要访问表数据，首先Client先去访问zookeeper，从zookeeper里面找到.META.表所在的位置信息，即找到这个.META.表在哪个HRegionServer上保存着。

(2) 接着Client通过刚才获取到的HRegionServer的IP来访问.META.表所在的HRegionServer，从而读取到.META.，进而获取到.META.表中存放的元数据。

(3)Client通过元数据中存储的信息，访问对应的HRegionServer，然后扫描(scan)所在HRegionServer的Memstore和Storefile来查询数据。

(4) 最后HRegionServer把查询到的数据响应给Client。

1.2、HBase写数据流程

写流程

(1) Client也是先访问zookeeper，找到-ROOT-表，进而找到.META.表，并获取.META.表信息。

(2) 确定当前将要写入的数据所对应的RegionServer服务器和Region。

(3) Client向该RegionServer服务器发起写入数据请求，然后RegionServer收到请求并响应。

(4) Client先把数据写入到HLog，以防止数据丢失。

(5) 然后将数据写入到Memstore。

(6) 如果Hlog和Memstore均写入成功，则这条数据写入成功。在此过程中，如果Memstore达到阈值，会把Memstore中的数据flush到StoreFile中。

(7) 当Storefile越来越多，会触发Compact合并操作，把过多的Storefile合并成一个大的Storefile。当Storefile越来越大，Region也会越来越大，达到阈值后，会触发Split操作，将Region一分为二。

提示：因为内存空间是有限的，所以说溢写过程必定伴随着大量的小文件产生。

二. 退役(decommissioning)

顾名思义，就是从当前HBase集群中删除某个RegionServer，这个过程分为如下几个过程：
在0.90.2之前，我们只能通过在要卸载的节点上执行

1.1第一种方案

(1)停止负载平衡器

hbase> balance_switch false

(2) 在退役节点上停止RegionServer

[root@bigdata11 hbase-1.3.1] hbase-daemon.sh stop regionserver

(3) RegionServer一旦停止，会关闭维护的所有region

(4) Zookeeper上的该RegionServer节点消失

(5) Master节点检测到该RegionServer下线，开启平衡器

hbase> balance_switch true

(6) 下线的RegionServer的region服务得到重新分配

这种方法很大的一个缺点是该节点上的Region会离线很长时间。因为假如该RegionServer上有大量Region的话，因为Region的关闭是顺序执行的，第一个关闭的Region得等到和最后一个Region关闭并Assigned后一起上线。这是一个相当漫长的时间。每个Region Assigned需要4s，也就是说光Assigned就至少需要2个小时。该关闭方法比较传统，需要花费一定的时间，而且会造成部分region短暂的不可用。

1.2另一种方案：

(1)新方法
自0.90.2之后，HBase添加了一个新的方法，即“graceful_stop”,只需要在HBase Master节点执行

$ bin/graceful_stop.sh <RegionServer-hostname>

该命令会自动关闭Load Balancer，然后Assigned Region，之后会将该节点关闭。除此之外，你还可以查看remove的过程，已经assigned了多少个Region，还剩多少个Region，每个Region 的Assigned耗时

(2)开启负载平衡器

hbase> balance_switch false

三Hbase集群出问题如何重置(学习的时候)

1.将zookeeper中的hbase结点删除
2.删除hdfs上的hbase目录
3.重新启动hbase

网友评论

本文标题：HBase读写数据流程

本文链接：https://www.haomeiwen.com/subject/ivednhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！