美文网首页
超算平台 | 交互式作业总结

超算平台 | 交互式作业总结

作者: 新_世_界 | 来源:发表于2021-07-16 10:24 被阅读0次

    刚开始学超算平台,有的命令记录下来,供以后温习!

    第一种: slurm 常用命令

    命令 功能
    speek 查看作业屏幕输出
    sinfo 查看队列和节点信息
    sacct 显示用户作业历史
    scontrol 查看详细队列信息
    squeue 显示当前作业状态
    sbatch 批处理方式提交作业
    scancel 取消指定作业
    sattch 吸附到作业步,没看懂

    假设有些集群设置以下队列,一般会有使用限制。For example,

    队列 说明
    You 允许但作业CPU核数为40-120,每核配10G内存,节点需独占使用,单节点配置为40核,1920G内存。
    Are 允许单作业CPU核数为1-100,每核配比30G内存,节点可共享使用;单节点配置为80核,3T内存。
    A 允许单作业CPU核数为1-45,每核配比16G内存,节点可共享使用,单节点配置为40核,182G内存。
    Good 允许但作业CPU 核数为1-87,每核配比66G内存,节点可贡献使用;单节点配置为40核,2TG内存。
    Dog 允许单作业CPU核数为1-32,推荐每核配比为42,每CPU配比20内存;单节点配置为96核,588G内存。

    每个队列都有默认最长运行时间,需要注意。如果需要延长,将jobid附在邮件中发送至自己超算中心的邮箱即可。

    需要注意的是:严禁在登录节点是运行作业和并行编程。如需交互操作,请申请计算资源:

    srun  -p  small  -n  8  --pty  /bin/sh
    ============================================  
    **账户存储使用情况**:
    账户存储免费使用额度为:xxxT
    hpc账户存储使用量为:xxxT
    myhpc用户存储使用量为:xxxG
    计费容量:xxx
    ============================================ 
    

    使用完以后可以通过exit 命令退出

    第二种: 分配式提交作业—salloc

    基本语法为:salloc [options] [<command> [command args]]

    salloc -p small -n 8   
    ============================================ 
    salloc:Granted job allocation  xxx
    saloc: Waiting for resource configuration
    salloc: Nodes xxx are ready for job
    账户存储免费使用额度为:xxxT
    hpc账户存储使用量为:xxxT
    myhpc用户存储使用量为:xxxG
    计费容量:xxxT
    ============================================ 
    

    相关文章

      网友评论

          本文标题:超算平台 | 交互式作业总结

          本文链接:https://www.haomeiwen.com/subject/hhwvpltx.html