连接HBase的正确姿势

作者: ad4d39659223 | 来源:发表于2018-04-17 18:56 被阅读445次

    摘要: 在云HBase值班的时候,经常会遇见有用户咨询诸如“HBase是否支持连接池?”这样的问题,也有用户因为应用中创建的Connection对象过多,触发了zookeeper的连接数限制,导致客户端连不上的。
    在云HBase值班的时候,经常会遇见有用户咨询诸如“HBase是否支持连接池?”这样的问题,也有用户因为应用中创建的Connection对象过多,触发了zookeeper的连接数限制,导致客户端连不上的。究其原因,都是因为对HBase客户端的原理不了解造成的。本文简单介绍HBase客户端的Connection对象与socket连接的关系,并给出Connection的正确用法。

    Connection是什么

    在云HBase用户中,常见的使用Connection的错误方法有:
    (1)自己实现一个Connection对象的资源池,每次使用都从资源池中取出一个Connection对象;
    (2)每个线程一个Connection对象。
    (3)每次访问HBase的时候临时创建一个Connection对象,使用完之后调用close关闭连接。
    从这些做法来看,这些用户显然是把Connection对象当成了单机数据库里面的连接对象来用了。然而,作为一个分布式数据库,HBase客户端需要和多个服务器中的不同服务角色建立连接,所以HBase客户端中的Connection对象并不是简单对应一个socket连接。HBase的API文档当中对Connection的定义是:
    A cluster connection encapsulating lower level individual connections to actual servers and a connection to zookeeper.
    我们知道,HBase访问一条数据的过程中,需要连接三个不同的服务角色:
    (1)Zookeeper
    (2)HBase Master
    (3)HBase RegionServer

    而HBase客户端的Connection包含了对以上三种socket连接的封装。Connection对象和实际的socket连接之间的对应关系如下图:
    在HBase客户端代码中,真正对应socket连接的是RpcConnection对象。HBase使用PoolMap这种数据结构来存储客户端到HBase服务器之间的连接。PoolMap封装了ConcurrentHashMap>的结构,key是ConnectionId(封装了服务器地址和用户ticket),value是一个RpcConnection对象的资源池。当HBase需要连接一个服务器时,首先会根据ConnectionId找到对应的连接池,然后从连接池中取出一个连接对象。
    HBase中提供了三种资源池的实现,分别是Reusable,RoundRobin和ThreadLocal。具体实现可以通过hbase.client.ipc.pool.type配置项指定,默认为Reusable。连接池的大小也可以通过hbase.client.ipc.pool.size配置项指定,默认为1。

    连接HBase的正确姿势


    从以上分析不难得出,在HBase中Connection类已经实现了对连接的管理功能,所以我们不需要自己在Connection之上再做额外的管理。另外,Connection是线程安全的,而Table和Admin则不是线程安全的,因此正确的做法是一个进程共用一个Connection对象,而在不同的线程中使用单独的Table和Admin对象。

    ///所有进程共用一个connection对象
    connection = ConnectionFactory.createConnection(config);
    ...
    ///每个线程使用单独的table对象
               Table table = connection.getTable(TableName.valueOf("test"));
               try {
                    ...
               } finally {
                   table.close();
               }
    

    HBase客户端默认的是连接池大小是1,也就是每个RegionServer 1个连接。如果应用需要使用更大的连接池或指定其他的资源池类型,也可以通过修改配置实现:

    config.set("hbase.client.ipc.pool.type",...);
    config.set("hbase.client.ipc.pool.size",...);
    connection = ConnectionFactory.createConnection(config);
    ...
    

    原文:连接HBase的正确姿势

    更多技术交流,可关注微信交流群,微信公众号等:

    或参考文章: HBase中文社区官网、交流群

    1. HBase社区微信群

    扫描添加小编微信好友(或搜索微信号: Mr_wanyue 添加),回复: HBase 加群
    2. HBase社区钉钉群:
    扫一扫添加
    3. 微信公众号:
    长按二维码关注HBase技术社区
    长按下面的二维码邀请加入HBase社区微信群

    相关文章

      网友评论

        本文标题:连接HBase的正确姿势

        本文链接:https://www.haomeiwen.com/subject/lafekftx.html