1. 简单的数据模型
ZK 允许通过共享的层次结构命名空间进行分布式进程间的相互协调,这与标准文件系统类似。名称空间由 ZooKeeper 中的数据寄存器组成,称为 ZNode,这些类似于文件和目录。 与为存储设计的典型文件系统不同,ZooKeeper 将数据保存在内存中,这意味着 ZooKeeper 可以实现高吞吐量和低延迟。
数据模型2. 可构建集群
为保障高可用,最好是以集群形态来部署 ZooKeeper,这样只要集群中大部分机器是可用的(能够容忍一定的机器故障),那么 Zookeeper 本身仍然是可用的。客户端在使用 ZooKeeper 时,需要知道集群机器列表,通过与集群中的某台机器建立 TCP 连接来使用服务,客户端使用这个 TCP 链接来发送请求、获取结果、获取监听事件以及发送心跳包,如果这个连接异常断开了,客户端可以连接到另外的机器上。
以下是 ZooKeeper 官方提供的架构图:
ZooKeeper 架构图上图中的每一个 Server 都代表一个 Zookeeper 服务的服务器,组成 ZooKeeper 服务的服务器都会在内存中维护当前的服务器状态,并且每台服务器之间都互相保持着通信,服务之间是通过 Zab 协议(Zookeeper Atomic Broadcast)来保持数据的一致性。
3. 顺序访问
对于来自客户端的每个更新请求,ZooKeeper 都会分配一个全局唯一的递增编号,这个编号反应了所有事务操作的先后顺序,应用程序可以借助 ZooKeeper 这个特性来实现更高层次的同步原语,这个编号也叫做时间戳 — zxid(Zookeeper Transaction Id)
4. 高性能
ZooKeeper 是高性能的,在 “读” 多于 “写” 的应用程序中尤其地高性能,因为 “写” 会导致所有的服务器间同步状态。(“读” 多于 “写” 是协调服务的典型情况)
网友评论