大数据开发：Hadoop HDFS Router中的RPC流转

作者: 成都加米谷大数据 | 来源:发表于2021-06-16 17:58 被阅读0次

大数据开发：Hadoop HDFS Router中的RPC流转
CDH常用端口汇总
大数据入门
Hadoop端口
【2019-04-28】Hadoop分布式文件系统
技术相关进程详解
HDFS
一起学Hive——创建内部表、外部表、分区表和分桶表及导入数据
Hadoop重要组成概述
大数据技术原理——MapReduce

Hadoop生态圈，到今天来说，依然是大数据技术学习当中的重点部分。在Hadoop当中，负责分布式文件存储的HDFS文件系统，也是至今仍然发挥着不可替代的作用。今天的大数据开发学习分享，我们主要来讲讲Hadoop HDFS Router中的RPC流转问题。

RBF Router概述

HDFS Router Federation是解决Namenode扩展性问题的一个方案，对原先的Federation+viewFS方案进行改进，可以理解为服务端的viewFS，相对于viewFS最大的好处在于做到对用户的完全透明。

核心概念：

l底层由多个namespace的子集群组成，可以是独立的hdfs集群，也可以是Federation集群，或者他们的混合。

l通常每个namenode节点上会部署一个Router，Router向客户端提供namenode接口的服务，Router本身无状态。

l StateStore维护federation的状态信息，比如底层NameNode的信息MembershipState、路径挂载信息MountTable等。默认的实现stateStore信息存放在zookeeper上。

RBF在原先的HDFS基础上增加了Router服务：

router对外提供了rpcServer、adminServer、httpServer服务接口；

支持全局的quota配置管理；

通过与NameNode心跳获取namenode元状态、地址等信息；

定时心跳更新自己在statestore里的状态（默认zookeeper实现）

RBF Router核心特性包括StateStore、QuotaManager、NameNodeHeartbeat等等，本文仅聚焦于Rpc的流转过程。

核心类介绍

Router提供了RouterRpcServer处理客户端的rpc请求。RouterRpcServer会实例化一个RouterRpcClient来做客户端与NameNodeRPC通信连接的媒介，几乎所有非Federation模式下的HDFS的RPC请求都会经过RouterRpcClient才能转发到具体的NameNode请求响应。

RouterRpcClient

RouterRpcClient作为Router到NameNode通信（用NameNode ClientProtocol）的客户端代理，提供了调用远程ClientProtocol方法、处理重试和故障转移的路由。将rpc转发到具体的NS，提供了以下几种调用方式：

invokeSingle

只向一个NS发起请求。

invokeSequential

向排序的多个NS顺序发起一连串的请求，直到一个请求返回正常结果、或者所有NS都被尝试过。

InvokeAll

类似invokeSequential,只是并发调用。

invokeConcurrent

向多个NS发起并发的请求，并且返回所有的结果整合

根据不同类型的rpc操作和不同的挂载策略，RpcClient会选择不同的调用方式。

RouterRpcClient里几个重要的成员变量：

ActiveNamenodeResolver：

用来获取NS的active namenode，其实现类MembershipNamenodeResolver通过与StateStoreService通信获取active NN并维护一个本地缓存以减少对statestore的访问。

ExecutorService：

提交与NameNode通信的异步任务的线程池服务，主要被invokeConcurrent调用。线程池大小可配置：dfs.federation.router.client.thread-size，默认32。

ConnectionManager：

连接池管理器，维护user到NN的连接池：Map<ConnectionPoolId,ConnectionPool>pools，每个user到一个NN的连接都在一个pool内。每个连接池的大小（单个pool内最大连接数）可配置：dfs.federation.router.connection.pool-size，默认值64。

ConnectionManager内有两个重要的线程：ConnectionCreator和CleanupTask，都是内部类，ConnectionCreator负责创建连接。CleanupTask负责清理过期的连接。

ConnectionPool：

代表一个用户到NN连接的连接池实例，一个ConnectionPool内有多个ConnectionContext。

值得注意的是，连接池和连接都是“懒加载”的，只有当有用户rpc请求getConnection时，才会创建一个pool。并且超时后会自动销毁。

连接池的作用也降低了Router作为rpc转发的性能损耗，不需要每次rpc请求时都实时创建rpc连接。可以预见，在持续稳定的运行生产环境中，Router对于NameNode Rpc吞吐的性能损耗很微小。

ConnectionContext：

代表一个实际的RPC连接，当一个client使用一个连接，numThreads会++，表示该连接是active的，不能被复用；当连接用完后，numThreads会--。client存储着NameNode的代理信息，可以获取代理对象。

总结：一条RPC流转涉及到RouterRpcServer，RouterRpcClient，RouterClientProtocol，ConnectionManager，ConnectionPool，ConnectionContext这些类。

RPC流转过程

1、RPC到达RouterRpcServer后，server委托RouterClientProtocol执行；

2、RouterClientProtocol将global路径根据mounttable解析成具体NS下的路径。

具体调用如下：

RouterRpcServer.getLocationsForPath()

--->MultipleDestinationMountTableResolver.getDestinationForPath()

--->MountTableResolver.getDestinationForPath()

--->从缓存locationCache获取

或者lookupLocation()-->findDeepest()找到最深的挂载路径。

注意：

1）一个global路径可能挂载到多个NS；

2）也可能当前path没有挂载，则递归寻找其已经挂载了的父目录；

3）如果父目录都没有挂载，则需要启用defaultNameServices（由dfs.federation.router.default.nameserviceId配置，默认为各个router所在NN节点的NS名）

3、获取到locations后，RouterRpcClient再根据挂载的策略和具体rpc类型，决定采用invokeSingle还是invokeAll，invokeSequential或者invokeConcurrent方式向NameNode发起请求，这几种invoke最终都会调用invokeMethod。

4、在invokeMethod向NameNode发请求时，需要通过RouterRpcClient获取User到NN的连接。调用ConnectionManager.getConnection()。

5、连接（ConnectionContext）的client中包含NameNode代理对象，最终反射实现具体的RPC请求发送。至此，一条经过Router转发的RPC就顺利到达NameNode了。

关于大数据开发学习，Hadoop HDFS Router中的RPC流转，以上就为大家做了简单的介绍了。在Hadoop生态，HDFS的重要性不必多说，而随着版本的更新，HDFS也在不断优化，学习当中也需要理解深入。