日更挑战当前排名:第95天,第3028名,较昨日前进37名。
继昨天解决Kafka的位移问题后,今天又发现一个hbase的region server无法重新启动的问题。这个server本身是有问题的,目前问题还未查。但是再重启的时候,会报三组错。其中一个明确为PG的错误,大意如下
PostgreSQL - Could not extend file No space left on device. HINT: Check free disk space
首先想到的就是检查本地磁盘,发现其实并没有满,这就很奇怪了。之后想到CDH会使用pg,那就把这部分先了解下。
查询了一下,发现确实是的,会有一个地方存储着pg相关登录信息。按网文说是/etc/cloudera-scm-server
,但我发现几个机器都只有/etc/cloudera-scm-agent
。所以必须找到server的机器,而其他集群里的都是agent的机器。
找到这个机器后,发现确实是空间满了。
根目录被撑满了那么依次用du -h --max-depth 1
命令查看目录,最终发现CDH的kafka manager的nohup文件是罪魁祸首。
用> nohup.out
把文件清空,再用CDH重启节点就没有问题了!
网友评论