下载安装包
#下载安装包
wget --no-check-certificate https://jaist.dl.sourceforge.net/project/gridscheduler/GE2011.11p1/GE2011.11p1.tar.gz
#解压
tar -zxvf GE2011.11p1.tar.gz
cd GE2011.11p1
cd source/
#执行
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump -only-depend
./scripts/zerodepend
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump depend
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump -no-qmon
出现报错:
In file included from ../Xmt310/Xmt/All.c:23:0:
../Xmt310/Xmt/Xmt.h:56:19: 致命错误:Xm/Xm.h:没有那个文件或目录
#include <Xm/Xm.h>
解决办法:
cd GE2011.11p1/source
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump -only-depend
./scripts/zerodepend
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump depend
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump -no-qmon
这个配置是不编译qmon
,因为系统没装X11,其他配置项,参考这个链接:
http://gridscheduler.sourceforge.net/CompileGridEngineSource.html
这个地方要注意下,将-no-qmon配置到
./aimk -no-java -no-jni -no-secure -spool-classic -no-dump depend
指令,貌似也会报错,要放到最后一行指令,具体我也不清楚什么原因。
配置环境变量
mkdir /usr/local/sge2011
export SGE_ROOT=/usr/local/sge2011
export cell=default
#执行
scripts/distinst -all -local -noexit
报错:
Installing libjuti.so
"libdb-4.4.so" not found. Assuming binaries are statically linked.
Installing libdrmaa.so.1.0
image.png
感觉又不像个报错,没有明显的报错信息Installation failed. Exiting.
,先不管了,配置好再说吧!
配置NFS
#配置主机名文件
cat /etc/hosts
192.168.0.33 xmxjy
127.0.1.4 xmxjyhost
#配置共享目录文件
cat /etc/exports
/usr/local/sge2011 192.168.0.33(rw,insecure,no_all_squash,no_root_squash,sync)
#执行
exportfs -av
修改集群的端口号
/etc/services
集群需要两个没有用过的集群端口号,默认的为
sge_qmaster 6444/tcp sge-qmaster # Grid Engine Qmaster Service
sge_qmaster 6444/udp sge-qmaster # Grid Engine Qmaster Service
sge_execd 6445/tcp sge-execd # Grid Engine Execution Service
sge_execd 6445/udp sge-execd # Grid Engine Execution Service
修改为不常用的端口号:
sge_qmaster 27100/tcp
sge_qmaster 27100/udp
sge_execd 27101/tcp
sge_execd 27101/udp
主控主机安装
#step1
cd $SGE_ROOT
#step2
新建文件hostlist,依次输入执行主机名,每个名字占一行,如下:
vim hostlist
hostname1
hostname2
#step3
./install_qmaster
按我发你的文件 sge安装.docx 执行
执行主机安装
1、创建用户:这里很多资料说创建一个新用户,我这里直接用自己的老用户账号
sudo adduser sgeadmin
3、执行:/opt/ge2011/default/common/settings.sh,设置环境变量,否则后面运行会有问题。
4、执行:/opt/ge2011/install_execd,下面是执行的过程.注意的点:
可以按我发你的sge安装.docx 执行
最后
将./opt/ge2011/default/common/settings.sh写到/etc/profile
网友评论