HBase设置外网访问集群

作者: 杨赟快跑 | 来源:发表于2019-06-22 13:18 被阅读0次

HBase集群搭建在内网,现在需要从外网访问HBase,对数据进行读写。

首先,需要明白HBase客户端连接HBase集群进行数据读写的流程


HBase架构图

1.写流程

1.Client先访问zookeeper,从Region中获取表信息;
2.根据namespace、表名和rowkey根据meta表的数据找到写入数据对应的RegionServerID;
3.通过RegionServerID定位到region;
4.写入数据到Region的Memstore,直到达到一定的阀值(128MB),MemStore中的数据被溢写Flush成一个StoreFile,(与此同时写入相同数据到log预写日志中);
5.随着StoreFile文件的不断增多,当其数量增长到一定阈值后,触发Compact合并操作,将多个StoreFile合并成一个StoreFile,StoreFile底层是HFile,同时进行版本合并和数据删除;
6.单个StoreFile超过一定阀值后,出发Split操作,把当前的RegionSplit分为两个新的Region,父Region此时就会下线,新Split出的2个子Region会被HMaster分配到相应的RegionServer上,使得原先1个Region的压力得以分流到2个Region上。

2.读流程

1.Client发送请求并访问zookeeper,获取meta表信息;
2.通过meta表中的Rowkey,tableName,TimeStamp定位到RegionID;
3.通过这个RegionID查找到相对应的RegionServer
4.查找到RegionServer中,先查找MemStore(写缓存),如果查不到,再进入BlockCache(读缓存)中查询,如果查不到,再进入StoreFile中查(依据StoreFile的索引查),并把结果放在BlockCache中。

所以,HBase客户端进行数据读写不会接触到HMaster,只会接触到zookeeper集群和和所有的regionserver节点。

3.修改HBase的RegionServer端口

HBase默认的RegionServer端口是16020,现在有多个RegionServer,需要为不同的RegionServer配置不同的端口

在Slave1节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16020</value>
        </property>

在Slave2节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16021</value>
        </property>

在Slave3节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16022</value>
        </property>

4.修改客户端/etc/hosts

HBase客户端通过zookeeper获取到regionserver的节点名和端口,例如slave1:16020,slave2:16021,slave3:16022,会解析本机的/etc/hosts文件,获取slave1,slave2,slave3的IP地址,所以,在/etc/hosts添加如下配置

59.69.101.206  slave1
59.69.101.206  slave2
59.69.101.206  slave3

这样,HBase客户端就能知道regionserver的IP和端口了,就能获取和写入数据了。

5.配置路由器

最后,还需要配置路由器,给zookeeper和regionserver节点配置端口映射。
这里的端口映射配置是

59.69.101.206:42181     zookeeper1.ip:2181
59.69.101.206:42182     zookeeper2.ip:2181
59.69.101.206:42183     zookeeper3.ip:2181

59.69.101.206:16020     slave1.ip:16020
59.69.101.206:16021     slave2.ip:16021
59.69.101.206:16022     slave3.ip:16022

5.客户端的hbase-site.xml配置如下

<property>
<name>hbase.zookeeper.quorum</name>
<value>59.69.101.206:42181,59.69.101.206:42182,59.69.101.206:42183</value>
</property>

相关文章

  • HBase设置外网访问集群

    HBase集群搭建在内网,现在需要从外网访问HBase,对数据进行读写。 首先,需要明白HBase客户端连接HBa...

  • Nginx配置hbaseweb转发

    目标 为了公司集群的安全考虑,hadoop和hbase的web访问只能供有限的人访问 而要实现内网机器给外网访问,...

  • Hbase java 客户端 DNS反向解析

    前言 在Ubuntu上搭建Hbase集群后,用hbase shell命令可以正常访问集群;但是,在本地用java客...

  • 阿里云redis外网访问

      阿里云redis外网访问设置步骤主要包括设置白名单、设置阿里云外网访问和通过redis-cli实现连接。具体步...

  • 通过nginx实现智能家居自动内外网切换

    设置同一个域名内外网分别访问对应的ip 搞了HomeAssistant的外网访问后,内外网访问需要不同的地址,导致...

  • Hadoop/Spark集群时间同步问题解决方法

    生产集群不会每台都有访问外网的权限,一般管理员会有master的外网访问权限,为了保证hadoop或spark程序...

  • 十、复制

    1、复制场景 1.1、现有一个SSD的HBase集群被业务方A访问,业务方A对HBase集群的延迟和可用性要求非常...

  • 设置django 外网访问

    开开启django时,使用0.0.0.0:xxxx,作为ip和端口 例如:python manage.py run...

  • postgresql 外网访问设置

    自己的一台破电脑被用来做服务器了,上面装了postgresql,需要能在局域网内访问,就查阅了写资料,总结如下。如...

  • redis 外网访问设置

    环境描述 linux 安装了redis需要让局域网内的另外一台服务器访问此机器上的redis 问题现象 在另一台主...

网友评论

    本文标题:HBase设置外网访问集群

    本文链接:https://www.haomeiwen.com/subject/vkwmqctx.html