在更换服务器后,相比以往在医院工作时用的服务器,现在提交命令时需要指定计算节点,为了理解大家在pbs脚本中的一些命令行,又补充学习了一下linux系统的基础知识。
集群和节点的概念:
集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。其中单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。
集群优越性:
使用集群起源于其良好的性能可扩展性(scalability)。提高cpu主频和总线带宽是最初提供计算机性能的主要手段。但是这一手段对系统性能的提供是有限的。接着人们通过增加CPU个数和内存容量来提高性能,于是出现了向量机,对称多处理机(SMP)等。但是当CPU的个数超过某一阈值,像SMP这些多处理机系统的可扩展性就变的极差。主要瓶颈在于CPU访问内存的带宽并不能随着CPU个数的增加而有效增长。因此,集群的优势显现出来了,集群系统的性能随着CPU个数的增加几乎是线性变化的。下图显示了这种情况:
其它优势:
高可用性:集群中的一个节点失效,它的任务可以传递给其他节点。可以有效防止单点失效。
高性能:负载平衡集群允许系统同时接入更多的用户。
高性价比:可以采用廉价的符合工业标准的硬件构造高性能的系统。
了解了集群和节点的概念后,就是使用了。
在服务器提交任务之前应养成看节点占用情况的习惯,然后将任务提交到free的节点,避免任务一直在队列中等待的情况,查看占用情况有下面两种方式。
pestat 显示出当前各节点占用情况,可根据任务号配合 qstat 命令找出占用用户。
其中node1是登陆节点,node10等是计算节点,提交任务时一定要提到到计算节点上去,这种设置了多节点分布式的计算集群,每个人固定分配几个节点,这才是多人使用一台服务器的正确模式。
如上图所示,state表示当前节点是否空闲,free表示空闲, busy表示繁忙,当state显示busy时,提交任务时不建议提交到该节点。
ncpus为当前节点总核心数,tasks为当前已提交任务占用核心数量。
pbsnodes -l free 只显示出当前free的节点。
本文使用 文章同步助手 同步
网友评论