IBM Platform LSF家族安装和配置简介 V1.0

发布时间 : 星期一 文章IBM Platform LSF家族安装和配置简介 V1.0更新完毕开始阅读

exit 0

在lsf.conf中定义LSB_ESUB_METHOD=”project”

2.10 配置资源管理elim示例

2.10.1 汇报home目录空闲大小

编辑elim文件elim.home,放置在$LSF_SERVERDIR下面。chmod为可执行。 #!/bin/sh

while true ; do

home=`df -k /home | tail -1 | awk '{printf \$4/(1024*1024)}'`

echo 1 home $home sleep 30 done

2.10.2 汇报root进程数目

编辑elim.root,放置在$LSF_SERVERDIR下面。chmod为可执行。 #!/bin/sh

while true ; do

root=`ps -ef | grep -v grep | grep -c ^root` echo 1 rootprocs $root sleep 30 done

2.10.3 汇报应用程序许可证数目 #!/bin/sh lic_X=0 ; num=0 while true ; do

# only want the master to gather lic_X if [ \

lic_X=`lmstat –a –c lic_X.dat | grep ...`>&2 fi

# only want training8, training1 to gather simpton licenses

13 | Page

if [ \ –o \

num=`lmstat –a –c simpton_lic.dat | grep ...`>&2 fi

# all hosts including master, will gather the following root=`ps –efw | grep –v grep | grep –c root`>>1&2 tmp=`df –k /var/tmp | grep var | awk '{print $4 /1024}'`>&2

if [ \

echo 4 lic_X $lic_X simpton $num rtprc $root tmp $tmp else

echo 3 simpton $num rtprc $root tmp $tmp fi

# the same INTERVAL values defined in lsf.shared sleep 60 done

2.10.4 测试elim脚本

直接运行./elim.root查看elim输出是否正确。

2.10.5 添加资源定义和资源地图

在lsf.shared文件中添加rootprocs 定义,并在lsf.cluster resources Map中添加资源和节点的映射关系。

使能配置:lsadmin reconfig; badmin reconfig 2.10.6 查看资源数目 lsload –l

3 LSF命令行集成应用示例

本节例举几个应用的不同集成方式。使用spooling文件或者bsub命令行都可以自由转换。

14 | Page

3.1 CFD++集成(spooling file)

3.1.1 CFD++安装和许可证 安装路径:ln-3620-4

许可证:/gpfs/software/cfdpp/mbin/Metacomp.lic 许可证服务器:ln-3620-4 启动许可证服务器:

[hpcadmin@mn-3650 jessi]$ ssh ln-3620-4

Last login: Tue Mar 26 19:19:24 2013 from mn-3650.private.dns.zone [hpcadmin@ln-3620-4 ~]$ /gpfs/software/cfdpp/mbin/lmgrd -c /gpfs/software/cfdpp/mbin/Metacomp.lic 确认许可证服务器是否正常运行:

/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic 3.1.2 集成许可证管理elim

添加elim方法:(elim全集群只需运行一个,因此只在头节点放置elim脚本即可) 在头节点:cd $LSF_SERVERDIR 添加如下文件:elim.lic:

[root@mn-3650 jessi]# cd $LSF_SERVERDIR [root@mn-3650 etc]# pwd

/opt/lsf/8.3/linux2.6-glibc2.3-x86_64/etc [root@mn-3650 etc]# cat elim.lic #!/bin/sh totallicences=`/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic |grep \ while true do usedlicences=`/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic | /bin/grep \ -f13` cfd_lic=$(( ${totallicences}-${usedlicences} )) echo \ /bin/sleep 30 done 15 | Page

[root@mn-3650 etc]# chmod a+x elim.lic 修改如下的配置文件:

[root@mn-3650 etc]# vi $LSF_ENVDIR/lsf.shared 添加如下一行:

cfd_lic Numeric 30 Y (CFD++ License) [root@mn-3650 etc]# vi $LSF_ENVDIR/lsf.cluster 在resourcemap一段添加如下一行: Begin ResourceMap

RESOURCENAME LOCATION cfd_lic [all] hostid [default] …

[root@mn-3650 etc]# lsadmin reconfig; badmin reconfig 3.1.3 添加CFD++ job starter

如果使用spooling file可不用添加。(Portal集成方式使用) 添加jobstarter可执行文件:

[hpcadmin@mn-3650 jessi]$ cat /opt/lsf/jobstarter/cfd_starter #!/bin/sh MPI_RUN=/gpfs/software/cfdpp/hpmpi/bin/mpirun case \ SINGLE_PRESSION) CFD_CMD=/gpfs/software/cfdpp/mbin/mcfd.11.1/r4_hpmpimcfd ;; DOUBLE_PRESSION) CFD_CMD=/gpfs/software/cfdpp/mbin/mcfd.11.1/hpmpimcfd ;; esac CMD=\ eval \ 16 | Page

联系合同范文客服:xxxxx#qq.com(#替换为@)