1、pid说明
pid就是进程号,hadoop组件启动之后会把各自进程的进程号信息写到文件中存储,hadoop执行停止shell的时候会到该文件中查找pid,然后kill掉。
2、默认存储路径
各进程的存储路径默认是存在/tmp目录,存储格式是hadoop-用户名-进程名.pid,如下所示:
3、风险
/tmp是Linux的系统目录,Linux系统会自动每三十天清空/tmp目录,pid文件删除以后会导致hadoop的相关停止shell没办法停止系统(但是不影响正在运行的进程),可能会影响生产的正常运行。
4、修改存储路径
HDFS的所有进程(NameNode、DataNode、SecondaryNameNode)的pid路径由环境变量HADOOP_PID_DIR控制,可以设置全局变量或者直接修改hadoop-env.sh(注意修改前需要先停止hadoop进程,如果直接修改再重启就会发现停止报错,除非修改回去或者直接kill进程),如下所示:
网友评论