Install 14 Package(s)
软件安装完成。进入配置阶段,初始配置相关的脚本在 " /usr/share/gridengine " 中。
[root@hostname ~]# cd /usr/share/gridengine
[root@hostname gridengine]# ls
bin doc hadoop install_qmaster lib my_configuration.conf qmon utilbin
ckpt examples install_execd inst_sge mpi pvm util
[root@hostname gridengine]#./install_qmaster
安装完成后,设置 “SGE_ROOT”
[root@hostname gridengine]# export SGE_ROOT=/usr/share/gridengine
开启服务
[root@hostname gridengine]# /etc/init.d/sgemaster start
Starting sgemaster: [ OK ]
[root@hostname gridengine]# /etc/init.d/sge_execd start
Starting sge_execd: [ OK ]
如果没有设置 “ SGE_ROOT ” 环境,执行命令就会收到这样的提示。
[root@hostname gridengine]# qhost
critical error: Please set the environment variable SGE_ROOT.
配置队列
在执行安装master主机上,初始安装后是将执行主机添加到了默认的 “all.q”队列中。在队列中的hostlist的那一行显示的执行主机名称是 “@allhosts”,这是一个主机组。需要用qconf命令编辑主机组。
[root@hostname gridengine]# qconf –sql 显示已经配置队列名称
all.q
[root@hostname gridengine]# qconf -mhgrp @allhosts
安装的时候使用默认的配置,主机组命名也是默认的。如果要使用这个名称,就必须编辑它,将主机名称加入主机组名称“@allhosts”。
[root@hostname gridengine]# qstat -f -u '*'
执行主机启动,主机列表中没有相应执行主机名称,执行qstat命令就不会看到有任何输出。
[root@hostname gridengine]# qstat -f
queuename qtype resv/used/tot. load_avg arch states
-------------------------------------------------------------------------------------------------------------------
all.q@hostname BIP 0/0/1 0.00 lx26-amd64
到此初步配置完成:
集群控制主机、执行主机、队列、主机组
用到的命令:
qconf 配置命令
qhost 主机状态等信息
qstat 队列状态、job状态
gridengine server 常规配置过程
队列配置:
qconf –aq all.q 新增加一个队列
qconf –mq all.q 配置(修改)一个队列
qconf –dq all.q 删除一个队列
qconf –sql 显示已存在的队列
主机组配置:
qconf –ahgrp @allhosts新增加一个主机组
qconf –mhgrp @allhosts配置(修改)一个主机组
qconf –dhgrp @allhosts删除一个主机组
qconf –shgrpl 显示已存在的主机组
用户组配置:
qconf –au opusers新增加一个用户组
qconf –mu opusers配置(修改)一个用户组
qconf –du opusers删除一个用户组
qconf –sul 显示已存在的用户组