概述
- Zookeeper的设计目的,可以根据它的名字“zoo”和“keeper”推断,即动物园的管理者,而这样命名的起因是很多分布式组件,如Hadoop是大象,tomcat是猫等,故zookeeper是一种分布式协调和分布式组件管理服务,即负责管理和协调一个复杂的分布式系统的各个组件,使得这些组件能够相互协作,共同构成一个分布式系统。
- 具体来说,Zookeeper是Hadoop生态的中的一个用于管理MapReduce集群的子项目,主要用于维护集群各子节点的状态,如新增,运行中,节点宕机等,以及当子节点状态发生变化时通知其他节点,如在集群中新增机器节点,或者某个节点挂了通知集群的其他节点。
-
在实现层面,Zookeeper是一个分布式目录服务,在每个zookeeper节点将所有数据组织成目录树结构,在各目录节点进行数据存储,数据存储方式如图,由父目录和子目录共同确定一个唯一路径:
在这里插入图片描述
核心设计
1. 目录节点的数据内容
- 由以上分析可知,zookeeper是基于目录树结构来存储数据的,即在每个目录树节点存放数据,而每个目录节点主要存放的数据包括节点状态数据和实际业务数据:
- 状态数据:节点名称,版本,ACL访问控制列表,即限制哪些ip可以访问该目录节点等;
- 业务数据:客户端存放在节点的数据,如机器的配置数据等。
- 目录节点的容量:由于zookeeper的定位是集群的协调和管理,故每个目录节点主要用于存放集群节点的相关配置信息,所以zookeeper规定每个目录节点最大不能超过1M,主要用来存放配置数据、状态数据等,而不是用于大数据存储。
- 目录的唯一性:由于目录节点的名称是路径引用,所以在整个目录树中,每个目录节点都是唯一的,即从根节点到当前目录节点的路径是唯一的。
2. 目录节点类型
- zookeeper所提供的功能主要是通过创建不同类型的目录节点来实现,即我们在使用zookeeper时,需要根据业务特征来确定需要创建哪种类型的节点。
- zookeeper包含四种类型的目录节点,分别为:
- 持久节点:PERSISTENT
- 持久顺序节点:PERSISTENT-SEQUENTIAL
- 临时节点:EPHEMERAL
- 临时顺序节点:EPHEMERAL-SEQUENTIAL
- 持久节点:客户端与zookeeper端口连接,节点依然存在,持久顺序节点:则是zookeeper会额外给这些持久节点的名称进行顺序编号。
- 临时节点:客户端与zookeeper断开连接,则节点自动删除;临时顺序节点,则是zookeeper会额外给这些临时节点的名称进行顺序编号。
3. 节点状态监听器Watcher
- zookeeper支持通过对某个目录节点znode设置监听器watcher来监视该目录节点的状态变化,包含该节点的数据内容变化和该节点的子节点变化。
- 具体使用方式为:客户端可以在相应目录节点znode设置监听器watcher,在该节点状态变化时,实时得到所该节点的当前最新状态信息。其中数据变化监听为对该节点调用exists或getData;对子节点列表的变化则是调用getChildren方法。
4. 高可用集群
- zookeeper作为一个分布式系统的协调管理者,将分布式系统的各个组件之间连接起来共同构成一个完整的系统,故zookeeper自身需要保证高可用,否则如果zookeeper自身挂了,则其管理的分布式系统的各个组件的协作就会被切断,导致整个分布式系统不可用,就如同动物园的笼子都打开了,动物到处乱跑,导致游客无法游览。
-
zookeeper的高可用主要是通过zookeeper集群的方式来实现的,如图上面蓝色部分就是zookeeper集群:
在这里插入图片描述 - 当某个zookeeper机器节点挂了,如leader节点,马上有另外一个zookeeper节点来接管它的的工作。zookeeper集群高可用的相关设计与实现和可能出现的问题,具体在后续文章详细分析。
运用场景
- zookeeper最初主要是对Hadoop的mapreduce集群的各个机器节点进行管理,后来将zookeeper项目独立出来之后,可以结合zookeeper的内部结构特点,即目录树结构和目录节点类型来运用在更多的场景。
1. 集群管理:临时节点的运用
- 集群管理是zookeeper的最初的一个运用场景,主要首先创建一个父目录节点,这个父目录节点代表一个集群,即可以将该目录节点的名称设置为集群名称,如cluster1,然后在该父目录节点下面创建多个子目录节点,其中节点类型为临时节点,每个子目录节点存储集群的一个机器节点的信息,具体如图所示:每个client节点代表一个机器节点 在这里插入图片描述
-
集群管理:所以可以在该父目录节点设置一个监听器watcher,监听其下面子节点的变化,从而能实时获取集群的机器节点的运作情况,如当某个机器宕机时,则其对应的临时节点就会被删除。
2. 配置管理:持久节点的运用
- 一个分布式系统可能需要通过部署多个节点来进行拓展,然后通过负载均衡设施来将请求分散到各个部署节点,从而应对高并发请求,避免单点问题。
-
为了避免当系统配置文件修改时,需要将配置文件更新到每个部署节点本地,可以将配置文件放在zookeeper的一个持久目录节点中,各个部署节点通过对该目录节点设置监视器watcher来实时获取该节点的数据内容变化,从而获取最新的配置文件信息,如图:
在这里插入图片描述
3. 服务统一命令服务
-
命名服务主要是利用了zookeeper的目录树的路径引用唯一的特性,所以可以通过一个完整的路径引用来唯一命名一个服务,如zookeeper作为dubbo的服务注册中心,每个目录节点代表某个Service的完整包名的一部分,完整路径代表一个Service。除此之外在底层节点保存当前的服务提供者和服务消费者ip信息,如图:
在这里插入图片描述
4. 分布式锁:临时顺序节点
- zookeeper用作分布式锁主要是利用了临时顺序节点的特性,即多个分布式机器节点同时往某个父目录节点下创建一个临时顺序节点,其中创建的节点的序号最小的机器获取该分布式锁,其他机器则需要等待。之后该机器断开连接,释放锁,则其对应的序号最小的临时节点就会被删除,则序号第二小的节点此时变成序号最小的节点,故对应的机器获取该分布式锁。
5. 消息队列
- 消息队列也是利用了临时顺序节点的特性,从而实现队列的FIFO功能。
网友评论