TGen建立了HPBC,为科学家提供他们需要的强大计算资源。“这是我能给PBS职业频道的有力支持之一……它只是工作。”
让Saguaro工作
如今,惠普银行通常在撒瓜罗上服务约65个账户,其中大多数都在TGen内部。ASU和其他研究机构的科学合作者也是该资源的活跃用户。他们使用BLAST、AMBER、Gaussian和其他商业和内部开发的应用程序在“撒瓜罗”上运行数千个工作。bob电竞官方PBS Professional提供了跨128个节点运行大型作业的灵活性,同时在单个节点上运行数千个小型串行作业。
Saguaro是一个16节点的开发集群,三台IBM SMP计算服务器(两台运行SUSE Linux,一台运行AIX)都运行在一个高性能SAN上,该SAN通过三个Cisco 4006交换机连接到Saguaro。用户可以使用集群上每个节点都可以访问的1TB ibmgpfs并行文件系统交互式地观看他们的作业。
PBS Professional帮助HPBC应对对Saguaro资源的需求的一个特点是不受干扰的可靠性和简单的维护。”“我可以给PBS专业版的一个响亮的赞誉是,一旦我们把它建立起来并开始工作,我就不必对它做任何事情,”洛威说去年,我将整个集群升级到Red Hat EL3.0。这个过程的一部分是重新安装PBS Professional。我按照手册上的说明做了大约20分钟。很简单。”
展望未来:升级和基于web的界面
HPBC的目标之一是将TGen转变为基于网络的工作提交模式,而一个基于网络的内部数据分析网站已经在运营。另一个目标是将灵活的队列与交换架构绑定在一起,这将使hbc能够在单个交换刀片上运行32节点作业,或在单个交换机上运行128节点作业,从而消除交换机到交换机通信的延迟。这些和其他进展将涉及PBS Professional。
TGen与PBS Professional的成功经验将很快导致升级版本,HPBC目前正在评估。特别感兴趣的是当前版本的作业阵列、冗余和故障转移特性。自2003年底正式投产以来,Saguaro得到了大量的利用,故障的增加是不可避免的。PBS Professional的自动作业恢复将在检测到节点已关闭时自动重做任何中断的作业。
“我很高兴升级我的生产集群,并在我们的高性能计算环境中寻找PBS Professional的其他用途是我今年的目标之一,”Lowey说。