刚开始学超算平台,有的命令记录下来,供以后温习!
第一种: slurm 常用命令
命令 | 功能 |
---|---|
speek | 查看作业屏幕输出 |
sinfo | 查看队列和节点信息 |
sacct | 显示用户作业历史 |
scontrol | 查看详细队列信息 |
squeue | 显示当前作业状态 |
sbatch | 批处理方式提交作业 |
scancel | 取消指定作业 |
sattch | 吸附到作业步,没看懂 |
假设有些集群设置以下队列,一般会有使用限制。For example,
队列 | 说明 |
---|---|
You | 允许但作业CPU核数为40-120,每核配10G内存,节点需独占使用,单节点配置为40核,1920G内存。 |
Are | 允许单作业CPU核数为1-100,每核配比30G内存,节点可共享使用;单节点配置为80核,3T内存。 |
A | 允许单作业CPU核数为1-45,每核配比16G内存,节点可共享使用,单节点配置为40核,182G内存。 |
Good | 允许但作业CPU 核数为1-87,每核配比66G内存,节点可贡献使用;单节点配置为40核,2TG内存。 |
Dog | 允许单作业CPU核数为1-32,推荐每核配比为42,每CPU配比20内存;单节点配置为96核,588G内存。 |
每个队列都有默认最长运行时间,需要注意。如果需要延长,将jobid附在邮件中发送至自己超算中心的邮箱即可。
需要注意的是:严禁在登录节点是运行作业和并行编程。如需交互操作,请申请计算资源:
srun -p small -n 8 --pty /bin/sh
============================================
**账户存储使用情况**:
账户存储免费使用额度为:xxxT
hpc账户存储使用量为:xxxT
myhpc用户存储使用量为:xxxG
计费容量:xxx
============================================
使用完以后可以通过exit 命令退出
第二种: 分配式提交作业—salloc
基本语法为:salloc [options] [<command> [command args]]
salloc -p small -n 8
============================================
salloc:Granted job allocation xxx
saloc: Waiting for resource configuration
salloc: Nodes xxx are ready for job
账户存储免费使用额度为:xxxT
hpc账户存储使用量为:xxxT
myhpc用户存储使用量为:xxxG
计费容量:xxxT
============================================
网友评论