美文网首页
超算平台 | SLURM 的使用

超算平台 | SLURM 的使用

作者: 新_世_界 | 来源:发表于2021-07-17 13:17 被阅读0次

对于我这个初学者而言,SLURM 学习还是有一定难度。本文参考:slurm入门,在此谢谢作者!

1. SLURM 的安装和使用

# 安装slurm及其依赖
sudo apt-get install slurm-llnl

2. 配置slurm

可使用在线是slurm 配置器,由它为我生成基于表单数据的配置文件。注意:需根据自己超算的情况进行修改。

面向单节点集群的SLURM 配置文件,这个还没弄,到时候再看!

# slurm.conf file generated by configurator.html.
# Put this file on all nodes of your cluster.
# See the slurm.conf man page for more information.
#
ControlMachine=mtj-VirtualBox
#
AuthType=auth/none
CacheGroups=0
CryptoType=crypto/openssl
MpiDefault=none
ProctrackType=proctrack/pgid
ReturnToService=1
SlurmctldPidFile=/var/run/slurmctld.pid
SlurmctldPort=6817
SlurmdPidFile=/var/run/slurmd.pid
SlurmdPort=6818
SlurmdSpoolDir=/tmp/slurmd
SlurmUser=slurm
StateSaveLocation=/tmp
SwitchType=switch/none
TaskPlugin=task/none
#
# TIMERS
InactiveLimit=0
KillWait=30
MinJobAge=300
SlurmctldTimeout=120
SlurmdTimeout=300
Waittime=0
#
# SCHEDULING
FastSchedule=1
SchedulerType=sched/backfill
SchedulerPort=7321
SelectType=select/linear
#
# LOGGING AND ACCOUNTING
AccountingStorageType=accounting_storage/none
ClusterName=cluster
JobCompType=jobcomp/none
JobCredentialPrivateKey = /usr/local/etc/slurm.key
JobCredentialPublicCertificate = /usr/local/etc/slurm.cert
JobAcctGatherFrequency=30
JobAcctGatherType=jobacct_gather/none
SlurmctldDebug=3
SlurmdDebug=3
#
# COMPUTE NODES
NodeName=mtj-VirtualBox State=UNKNOWN
PartitionName=debug Nodes=mtj-VirtualBox default=YES MaxTime=INFINITE State=UP

最后一步说是生成一组作业凭证秘钥,且使用openssl 作为其凭证秘钥。

清单2. 为slurm 创建凭证

$ sudo  openssl  genrsa  -out  /usr/local/etc/slurm.key  1024
Generating RSA private key, 1024 bit long modulus
.................++++++
............................................++++++
e is 65537 (0x10001)
$ sudo openssl  rsa  -in  /usr/local/etc/slurm.key -pubout -out /usr/local/etc/slurm.cert
writing RSA key

完成凭证后,可以启动slurm 并与其交互。

3. 启动slurm

$ sudo /etc/init.d/slurm-llnl start  

清单3. 使用sinfo命令来查看集群

$ info
================================================================    
PARTITION     AVAIL    TIMELIMIT    NODES   STATE     NODELIST 
debug*        up       infinite     1       idle      mtj-VirtualBox    
================================================================

4. 更多的slurm命令

scontrol
清单4 . 用scontrol 了解集群详细信息

相关文章

  • 超算平台 | SLURM 的使用

    对于我这个初学者而言,SLURM 学习还是有一定难度。本文参考:slurm入门[https://blog.csdn...

  • 超算平台 | SLURM 作业调度系统使用

    一、交互式提交任务 pkurun pkubatch 二、脚本提交任务 并行计算,使用了openMPI 编译生成可...

  • CentOS7平台部署Slurm 21.08

    参考文章:超算平台安装 CentOS7下安装slurm20.11[http://blog.chinaunix.ne...

  • 超算平台 | 交互式作业总结

    刚开始学超算平台,有的命令记录下来,供以后温习! 第一种: slurm 常用命令 命令功能speek查看作业屏幕输...

  • 11.md

    #西湖大学超算中心使用 西湖大学超算平台的管理节点(任务提交)为: > 172.16.10.253 端口号: 95...

  • 2018-11-16

    西湖大学超算中心使用 西湖大学超算平台的管理节点(任务提交)为: 172.16.10.253 端口号: 9527...

  • slurm使用

    1、构建一个.slurm脚本 seri 2、提交作业 3、查看作业 4、删除作业

  • TOOLs:slurm集群的使用

    目前用过的集群系统有PBS/qsub系统,感觉是命令简单,容易上手。现在使用的是SLURM系统,SLURM系统常用...

  • slurm 的使用教程

    最近因为上课的原因,频繁的使用到了slurm脚本,所以在这边简单记录一下 基本概念:什么是slurm脚本? Slu...

  • pyslurm的使用

    pyslurm是slurm API的python扩展库, 通过调用slurm的api接口,获取slurm集群的状态...

网友评论

      本文标题:超算平台 | SLURM 的使用

      本文链接:https://www.haomeiwen.com/subject/xpkipltx.html