基因组学研究院

Altair PBS Professional™at the Translational Genomics Research Institute (TGen):缩短发现时间

客户档案

近年来,世界各地的企业和研究机构已经应用大量的计算资源来定义人类基因组的组成。最大的挑战之一是将这些知识转化为治疗和诊断这是转化基因组学研究所(TGen)的使命。TGen是一个卓越的非营利组织,由亚利桑那州、亚利桑那州市政府、印第安部落社区、教育机构、私人基金会和企业实体共同努力建立的。TGen的工作不仅是发现基因,还将这些发现转化为造福人类健康的新诊断测试和疗法。

在亚利桑那州立大学(ASU)的支持下,TGen在ASU坦佩校区建立了高性能生物计算中心(HPBC),为其科学家提供他们需要的强大的计算资源,以发现基因变化如何促进疾病进展和耐药性治疗。用hbc的使命声明的话说,这些资源“有助于增强研究人员将基因组发现迅速转化为诊断和治疗的能力。”

设置TGen的计算心跳

TGen于2002年在凤凰城成立,最初有23名科学家。2003年3月,ASU采购了高性能计算机,包括一个512节点的IBMeServer集群1350,以支持TGen的翻译基因组学研究项目。2003年4月,IBM开始安bob官网 bob体育下载装eServer群集,在1024个Intel Xeon处理器上运行Red Hat Linux。到7月,HPBC已经在集群系统Saguaro上进行了基因测序和其他过程的生产类型测试。到9月下旬,它已全面投产。PBS Professional的工作负载管理软件从一开始就是Saguaro不可或缺的一部分。

TGen高性能计算系统经理James Lowey说:“我们已经在16节点的开发集群上安装了OpenPBS,这是一个缩小版的Saguaro,比Saguaro上线要快得多。”“但它没有提供PBS Professional所做的很多事情。PBS Professional给我的一个关键因素是会计——查看正在运行的作业数量和每个作业所花费的时间的能力。

“最终,TGen的CIO Dr. Edward Suh选择了PBS Professional,因为我们需要一个供应商支持的产品,能够满足我们在Saguaro(512节点生产集群)上提供灵活的作业调度的需求。我们对该产品的性能非常满意。”
TGen建立了HPBC,为科学家提供他们需要的强大计算资源。“这是我能给PBS职业频道的有力支持之一……它只是工作。”

让Saguaro工作

如今,惠普银行通常在撒瓜罗上服务约65个账户,其中大多数都在TGen内部。ASU和其他研究机构的科学合作者也是该资源的活跃用户。他们使用BLAST、AMBER、Gaussian和其他商业和内部开发的应用程序在“撒瓜罗”上运行数千个工作。bob电竞官方PBS Professional提供了跨128个节点运行大型作业的灵活性,同时在单个节点上运行数千个小型串行作业。

Saguaro是一个16节点的开发集群,三台IBM SMP计算服务器(两台运行SUSE Linux,一台运行AIX)都运行在一个高性能SAN上,该SAN通过三个Cisco 4006交换机连接到Saguaro。用户可以使用集群上每个节点都可以访问的1TB ibmgpfs并行文件系统交互式地观看他们的作业。

PBS Professional帮助HPBC应对对Saguaro资源的需求的一个特点是不受干扰的可靠性和简单的维护。”“我可以给PBS专业版的一个响亮的赞誉是,一旦我们把它建立起来并开始工作,我就不必对它做任何事情,”洛威说去年,我将整个集群升级到Red Hat EL3.0。这个过程的一部分是重新安装PBS Professional。我按照手册上的说明做了大约20分钟。很简单。”

展望未来:升级和基于web的界面

HPBC的目标之一是将TGen转变为基于网络的工作提交模式,而一个基于网络的内部数据分析网站已经在运营。另一个目标是将灵活的队列与交换架构绑定在一起,这将使hbc能够在单个交换刀片上运行32节点作业,或在单个交换机上运行128节点作业,从而消除交换机到交换机通信的延迟。这些和其他进展将涉及PBS Professional。

TGen与PBS Professional的成功经验将很快导致升级版本,HPBC目前正在评估。特别感兴趣的是当前版本的作业阵列、冗余和故障转移特性。自2003年底正式投产以来,Saguaro得到了大量的利用,故障的增加是不可避免的。PBS Professional的自动作业恢复将在检测到节点已关闭时自动重做任何中断的作业。

“我很高兴升级我的生产集群,并在我们的高性能计算环境中寻找PBS Professional的其他用途是我今年的目标之一,”Lowey说。