HBase设置外网访问集群

作者: 杨赟快跑 | 来源:发表于2019-06-22 13:18 被阅读0次

    HBase集群搭建在内网,现在需要从外网访问HBase,对数据进行读写。

    首先,需要明白HBase客户端连接HBase集群进行数据读写的流程


    HBase架构图

    1.写流程

    1.Client先访问zookeeper,从Region中获取表信息;
    2.根据namespace、表名和rowkey根据meta表的数据找到写入数据对应的RegionServerID;
    3.通过RegionServerID定位到region;
    4.写入数据到Region的Memstore,直到达到一定的阀值(128MB),MemStore中的数据被溢写Flush成一个StoreFile,(与此同时写入相同数据到log预写日志中);
    5.随着StoreFile文件的不断增多,当其数量增长到一定阈值后,触发Compact合并操作,将多个StoreFile合并成一个StoreFile,StoreFile底层是HFile,同时进行版本合并和数据删除;
    6.单个StoreFile超过一定阀值后,出发Split操作,把当前的RegionSplit分为两个新的Region,父Region此时就会下线,新Split出的2个子Region会被HMaster分配到相应的RegionServer上,使得原先1个Region的压力得以分流到2个Region上。

    2.读流程

    1.Client发送请求并访问zookeeper,获取meta表信息;
    2.通过meta表中的Rowkey,tableName,TimeStamp定位到RegionID;
    3.通过这个RegionID查找到相对应的RegionServer
    4.查找到RegionServer中,先查找MemStore(写缓存),如果查不到,再进入BlockCache(读缓存)中查询,如果查不到,再进入StoreFile中查(依据StoreFile的索引查),并把结果放在BlockCache中。

    所以,HBase客户端进行数据读写不会接触到HMaster,只会接触到zookeeper集群和和所有的regionserver节点。

    3.修改HBase的RegionServer端口

    HBase默认的RegionServer端口是16020,现在有多个RegionServer,需要为不同的RegionServer配置不同的端口

    在Slave1节点上,hbase-site.xml文件添加配置如下

            </property>
                    <property>
                    <name>hbase.regionserver.port</name>
                    <value>16020</value>
            </property>
    

    在Slave2节点上,hbase-site.xml文件添加配置如下

            </property>
                    <property>
                    <name>hbase.regionserver.port</name>
                    <value>16021</value>
            </property>
    

    在Slave3节点上,hbase-site.xml文件添加配置如下

            </property>
                    <property>
                    <name>hbase.regionserver.port</name>
                    <value>16022</value>
            </property>
    

    4.修改客户端/etc/hosts

    HBase客户端通过zookeeper获取到regionserver的节点名和端口,例如slave1:16020,slave2:16021,slave3:16022,会解析本机的/etc/hosts文件,获取slave1,slave2,slave3的IP地址,所以,在/etc/hosts添加如下配置

    59.69.101.206  slave1
    59.69.101.206  slave2
    59.69.101.206  slave3
    

    这样,HBase客户端就能知道regionserver的IP和端口了,就能获取和写入数据了。

    5.配置路由器

    最后,还需要配置路由器,给zookeeper和regionserver节点配置端口映射。
    这里的端口映射配置是

    59.69.101.206:42181     zookeeper1.ip:2181
    59.69.101.206:42182     zookeeper2.ip:2181
    59.69.101.206:42183     zookeeper3.ip:2181
    
    59.69.101.206:16020     slave1.ip:16020
    59.69.101.206:16021     slave2.ip:16021
    59.69.101.206:16022     slave3.ip:16022
    

    5.客户端的hbase-site.xml配置如下

    <property>
    <name>hbase.zookeeper.quorum</name>
    <value>59.69.101.206:42181,59.69.101.206:42182,59.69.101.206:42183</value>
    </property>
    

    相关文章

      网友评论

        本文标题:HBase设置外网访问集群

        本文链接:https://www.haomeiwen.com/subject/vkwmqctx.html