zookeeper本身实现了高可用,才可以对分布式集群提供服务;
本质上: zookeeper提供了两个功能, 可以存储少量数据(此部分数据是不会丢失的), 可以监控其他线程;
1. 下载zookeeper软件, 并把安装包上传到服务器
2. 解压安装包 tar -zxvf xxx -C xxx
3. 配置环境变量 修改/etc/profile文件
export ZK_HOME=/home/one/app/*
export PATH=$PATH:$ZK_HOME/bin
注: 将配置文件刷入内存, source
4. 修改zk中的参数, 同时将配置文件名修改为: zoo.cfg
vi .../zookeeper/conf/zoo.cfg
注: zk的默认配置文件名为 zoo.cfg
多台机器中每台机器的配置文件内容都相同,内容如下:
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/root/data/zk
dataLogDir=/root/log/zk
clientPort=2181
server.1=node01:2888:3888
server.2=node02:2888:3888
server.3=node03:2888:3888
注: 两个参数必须配置 a. zookeeper的工作路径 b. 添加主机信息
5. 创建zk软件的存储数据的路径xxx/zkdata/zookeeper, 以及在创建的目录下创建文件myid
注: 此文件的名称必须是 myid , 并且将数字保存,比如将 1 存进去; 存储的是此节点的机器id, 用作标识;
6. 给各个没有配置zk的节点发送软件: 通过scp 命令, 之后修改各个节点的参数;
7. 启动zk服务器:
zkServer.sh start/stop/status [./conf/zk.cfg]
=>参数解释:
tickTime=2000
initLimit=5
syncLimit=2
dataDir=zk软件的工作路径,也就是数据存储路径
clientPort=2181
#zk知道有那些节点, 其中server后的数字是节点的id, 2888为内部通信端口, 3888为投票端口
server.1=newhadoop:2888:3888
server.2=newhadoop01:2888:3888
server.3=newhadoop02:2888:3888
网友评论