torque 安装配置笔记
【封面图片:宁波银行相聚的“网友”们-2021】torque 安装配置笔记
一、环境简介
- OS: CentOS-7.x
- 版本:torque-4.2.10
- 主机名:master
二、安装步骤
设置主机名
# hostnamectl set-hostname master
# vim /etc/hosts
IP地址 master
注意:设置主机名后,DNS必须能解析,否则初始化时会失败。
安装torque运行环境和依赖库
# yum -y install libxml2-devel make openssl-devel gcc gcc-c++ boost-devel libtool
下载torque安装包,解压后直接三部曲安装即可
# export version=4.2.10
# wget https://dl.vqiu.cn/package/torque/torque-${version}.tar.gz
# cd torque-$version
# ./configure --prefix=/usr/local/torque \
--with-scp \
--with-default-server=master
# make $(nproc --all)
# make install
# make packages
提示:with-default-server设置主机名,更多版本移步:https://src.fedoraproject.org/repo/pkgs/torque
将contrib/init.d/目录下的pbs_server、pbs_sched、pbs_mom、trqauthd添加到系统初始化简脚本/etc/init.d/中,并设置为开机启动。
# for svc in pbs_server pbs_sched pbs_mom trqauthd; do
\cp contrib/init.d/${svc} /etc/init.d/
chkconfig --add $svc
chkconfig $svc on
done
设置系统环境变量
# prefix=/usr/local/torque
# echo "TORQUE=$prefix" >>/etc/profile
echo "export PATH=\$PATH:$prefix/bin:$prefix/sbin" >>/etc/profile.d/torque.sh
source /etc/profile.d/torque.sh
# echo "$prefix/lib" > /etc/ld.so.conf.d/torque.conf
ldconfig
三、环境配置
由于torque不能使用超级管理员运行,所以需要创建一个普通用户--比如zhang3
,同时将 zhang3 设为 torque 的管理账户。
export USER=zhang3
# torque.setup $USER
# useradd $USER
注意:
torque.setup
命令位于tarball安装目录下,没有zhang3用户则新增之
将master节点设置可分配40个任务数量
# cat >/var/spool/torque/server_priv/nodes<<EOF
master np=40
EOF
设置日志级别
# cat> /var/spool/torque/mom_priv/config<<EOF
master server
logevent 255
EOF
配置完成后,启动pbs_server、pbs_sched、pbs_mom、trqauthd几个服务
/etc/init.d/pbs_server restart
/etc/init.d/pbs_sched restart
/etc/init.d/pbs_mom restart
/etc/init.d/trqauthd restart
使用qnodes
命令查看节点信息
# qnodes
master
state = free
np = 40
ntype = cluster
status = rectime=1646837244,varattr=,jobs=,state=free,netload=1420515423,gres=gitee:-ansible server,loadave=0.01,ncpus=2,physmem=4045016kb,availmem=3221776kb,totmem=4045016kb,idletime=188794,nusers=2,nsessions=2,sessions=1112 1553,uname=Linux gitee-ansible 3.10.0-1160.41.1.el7.x86_64 #1 SMP Tue Aug 31 14:52:47 UTC 2021 x86_64,opsys=linux
mom_service_port = 15002
mom_manager_port = 15003
四、任务测试
# su zhang3
$ echo sleep 200 | qsub
$ qstat -an
$ qstat -an
gitee-ansible:
Req'd Req'd Elap
Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time
----------------------- ----------- -------- ---------------- ------ ----- ------ ------ --------- - ---------
1.zhang3 zhang3 batch STDIN 21885 1 1 -- 01:00:00 R 00:00:24
zhang3/0
2.zhang3 zhang3 batch STDIN 22007 1 1 -- 01:00:00 R 00:00:05
master/1