今天来发现zk集群突然ji间就不能访问了,检查了每台机器发现是有机器的磁盘空间不够了(测试环境没告警,告警除了zabbix还有啥好用的?)
Filesystem Size Used Avail Use% Mounted on
/dev/sda2 31G 31G 0 100% /
devtmpfs 911M 0 911M 0% /dev
tmpfs 920M 0 920M 0% /dev/shm
tmpfs 920M 28M 892M 4% /run
[root@arch-ceshi01 home]# cd /ho-bash: cannot create temp file for here-document: No space left on device
然后发现在/home/zk/data/version-2目录下大量的log.xxxxx和snapshot.xxxxx文件。(/home/zk/data是自己在配置文件中配置的)这些log.xxxxx和snapshot.xxxxx文件是可以删除的。
我用的是zookeeper 3.4.13版本,在3.4版本以后,zk提供了两个配置来自动删除这些文件
#保存的数量
autopurge.snapRetainCount=5
#清理时间间隔,单位是小时
autopurge.purgeInterval=1
配置默认是关闭的(注释掉的),把注释去掉,重启服务就可以了。
对于低于3.4的版本,zk的bin目录下有个 zkCleanup.sh命令来删除的。(看来这个坑是由来已久)
网友评论