在关闭了计算节点的超线程后,因为实际CPU数量低,会导致节点的DOWN,因此需要进行配置
因为使用的是slurm-roll安装的slurm系统,因此配置文件中的包含的节点信息是脚本根据rocks系统属性自动生成的,因此需要修改rocks系统对节点的属性配置,此处将节点的cpu数量设置为了12个core。
rocks set cpus compute-0-3 12
然后需要进行rocks系统的配置同步
rocks sync config
进行slurm系统的配置同步
rocks sync slurm
因为slurm-roll在自己负责的集群中安装的有问题,无法使用这个同步方式,所以此处我调用的自己的同步脚本。
以上均为事后记录,仅记录了思路,以供后续的运维。
网友评论