torque 安装配置笔记

一、环境简介

  • OS: CentOS-7.x
  • 版本:torque-4.2.10
  • 主机名:master

二、安装步骤

设置主机名

# hostnamectl set-hostname master
# vim /etc/hosts
IP地址   master

注意:设置主机名后,DNS必须能解析,否则初始化时会失败。

安装torque运行环境和依赖库

# yum -y install libxml2-devel make openssl-devel gcc gcc-c++ boost-devel libtool 

下载torque安装包,解压后直接三部曲安装即可

# export version=4.2.10
# wget https://dl.vqiu.cn/package/torque/torque-${version}.tar.gz
# cd torque-$version

# ./configure --prefix=/usr/local/torque \
            --with-scp \
            --with-default-server=master
# make $(nproc --all)
# make install
# make packages

提示:with-default-server设置主机名,更多版本移步:https://src.fedoraproject.org/repo/pkgs/torque

将contrib/init.d/目录下的pbs_server、pbs_sched、pbs_mom、trqauthd添加到系统初始化简脚本/etc/init.d/中,并设置为开机启动。

# for svc in pbs_server pbs_sched pbs_mom trqauthd; do 
    \cp contrib/init.d/${svc} /etc/init.d/
    chkconfig --add $svc
    chkconfig $svc on
done

设置系统环境变量

# prefix=/usr/local/torque  
# echo "TORQUE=$prefix" >>/etc/profile
echo "export PATH=\$PATH:$prefix/bin:$prefix/sbin" >>/etc/profile.d/torque.sh
source /etc/profile.d/torque.sh

# echo "$prefix/lib" > /etc/ld.so.conf.d/torque.conf
ldconfig

三、环境配置

由于torque不能使用超级管理员运行,所以需要创建一个普通用户--比如zhang3,同时将 zhang3 设为 torque 的管理账户。

export USER=zhang3
# torque.setup $USER
# useradd $USER

注意:torque.setup 命令位于tarball安装目录下,没有zhang3用户则新增之

将master节点设置可分配40个任务数量

# cat >/var/spool/torque/server_priv/nodes<<EOF
master np=40
EOF

设置日志级别


# cat> /var/spool/torque/mom_priv/config<<EOF
master server
logevent 255
EOF

配置完成后,启动pbs_server、pbs_sched、pbs_mom、trqauthd几个服务

/etc/init.d/pbs_server restart 
/etc/init.d/pbs_sched restart  
/etc/init.d/pbs_mom restart  
/etc/init.d/trqauthd restart

使用qnodes 命令查看节点信息

# qnodes
master
     state = free
     np = 40
     ntype = cluster
     status = rectime=1646837244,varattr=,jobs=,state=free,netload=1420515423,gres=gitee:-ansible server,loadave=0.01,ncpus=2,physmem=4045016kb,availmem=3221776kb,totmem=4045016kb,idletime=188794,nusers=2,nsessions=2,sessions=1112 1553,uname=Linux gitee-ansible 3.10.0-1160.41.1.el7.x86_64 #1 SMP Tue Aug 31 14:52:47 UTC 2021 x86_64,opsys=linux
     mom_service_port = 15002
     mom_manager_port = 15003

四、任务测试

# su zhang3
$ echo sleep 200 | qsub
$ qstat -an
$ qstat -an 

gitee-ansible: 
                                                                                  Req'd    Req'd       Elap
Job ID                  Username    Queue    Jobname          SessID  NDS   TSK   Memory   Time    S   Time
----------------------- ----------- -------- ---------------- ------ ----- ------ ------ --------- - ---------
1.zhang3         zhang3       batch    STDIN             21885     1      1    --   01:00:00 R  00:00:24
   zhang3/0
2.zhang3         zhang3       batch    STDIN             22007     1      1    --   01:00:00 R  00:00:05
   master/1

五、参考引用