开源和商用HPC工作负载管理器的成本效益对比

阅读白皮书

bob官网 bob体育下载高性能计算(HPC)推动了多个行业的科学发现和创新。大型数据集、高级模拟技术和机器学习的结合帮助组织生成洞见,这在没有现代HPC基础设施的情况下是不可能的。

考虑到高性能计算在推动业务结果方面的巨大作用,选择正确的管理软件是至关重要的。在时间就是金钱的商业组织中尤其如此。在本文中,我们讨论了开源软件在高性能计算中的优缺点,并为商业工作负载管理提供了案例。虽然开源工作负载管理器在某些情况下很好,但它们在生产环境中可能存在缺点。

所有相关白皮书

基本的公平分享牛郎星PBS专业

基本的公平分享牛郎星PBS专业

Fairshare是一个强大的工具,用于共享资源,并将集群的一定数量分配给用户、组和项目等实体。这篇白皮书将让你与牛郎星PBS专业的基本公平分享运行。

技术论文,白皮书
使用牛郎星PBS专业放置集

使用牛郎星PBS专业放置集

PBS Professional调度器提供了许多不同的方法来优化调度。放置集(也称为感知拓扑的调度)可用于根据共享特征将节点分组,以帮助优化作业性能以及PBS Professional复合结构的总体使用。常见的用法包括利用互连或硬件拓扑(包括IRUs或机架)、系统资源、对共享存储的访问、系统位置和应用程序可用性。

技术论文,白皮书
公平共享管理为牛郎星PBS专业

公平共享管理为牛郎星PBS专业

Fairshare是一个PBS专业的调度工具,可以根据集群的使用历史和分配百分比来共享集群有限的资源。将集群上一定比例的共享资源授予用户、项目或组是最直接的选择。本白皮书将介绍如何为您的PBS复合体创建和管理fairshare树结构。它还涵盖了fairshare树中的基本设置和描述共享的概念。本文不涉及理解、计算和管理实体使用数据。本文假设您熟悉fairshare的基本设置,以及fairshare与其他PBS Professional调度工具的限制和注意事项。启用基本fairshare不考虑fairshare树的功能和结构,也不描述如何创建和管理树。将集群的一定比例授予单个用户可能是不可行的;集群的使用可以根据队列、项目或会计来定义。此外,一些用户可能跨越多个组。 Your site’s policy may require the restriction of cluster use to only known entities. PBS Professional’s weighted rooted tree structure provides the opportunity to group entities together and finely manage the balance of resources on your cluster. Adapting resource usage allows you to dictate tracked resources and apply a formula to balance those resources according to your site’s needs.

技术论文,白皮书
短期运行的作业可以帮助优化您的资源利用

短期运行的作业可以帮助优化您的资源利用

半导体公司通常通过将作业排队,然后使用作业调度程序将它们分派到服务器群中可用的核心上,同时从许可服务器中提取EDA工具许可。企业面临两个主要目标,但它们之间有些矛盾:首先,最大化利用服务器群和软件许可证;其次,以最小的延迟运行作业,这样用户就不会受到延迟。满足高利用率和低延迟需求的最简单方法是最大化短期作业的数量。就像用沙子填桶比用大石头填桶更容易一样,短期任务在运行哪些任务和何时运行方面给调度程序带来了更大的灵活性。短期任务不会长时间阻塞或占用资源,因此不太可能阻碍高优先级任务进入队列的进程。Altair Accelerator™是一款灵活、功能齐全的调度器,针对当今的EDA工作负载进行了优化。Accelerator和其他流行的调度器之间最重要的区别是它的事件驱动架构,它允许在计算资源和软件许可可用时立即调度新任务。

技术论文,白皮书
应对各种规模组织的工作调度挑战

应对各种规模组织的工作调度挑战

每个半导体设计小组都使用某种工作调度程序,不管它是由企业it部门还是小组本身选择的。在较高的层次上,作业调度程序的功能很简单:注意队列中有什么,哪些硬件和软件许可资源可用,并就何时调度哪些作业做出正确的决策。在实践中,有几个微妙的问题同样重要,包括工作组合、优先级划分和支持的易用性。虽然每个公司都是独特的,但围绕工作调度的问题往往与公司规模有关,或者更准确地说,与计算场和设计团队的规模有关。Altair Accelerator™是一款高吞吐量的企业级作业调度程序,旨在满足半导体设计、EDA和高性能计算(HPC)的复杂需求。bob官网 bob体育下载它是一种适应性很强的解决方案,能够管理从小型专用服务器群到复杂的分布式环境的计算基础设施。

技术论文,白皮书
了解牛星PBS专业版Fairshare用法

了解牛星PBS专业版Fairshare用法

Fairshare是Altair®PBS Professional®调度工具,旨在根据集群使用历史和实体的分配百分比共享集群有限的资源。Fairshare是将集群上一定比例的共享资源授予用户、项目或组的最直接的选项。本白皮书涵盖了PBS Professional如何收集和管理公平份额的使用。通过本文档,您应该能够遍历fairshare的每个逻辑步骤,从pbsfs输出理解每个数字。它还包括如何手动更改每个实体的使用数据。

技术论文,白皮书
将节点与一个或多个队列关联

将节点与一个或多个队列关联

PBS Professional为用户提供了一个将作业提交到队列的界面,该队列将由调度器考虑并分派给集群、超级计算机或云中的计算资源。这个默认配置对用户没有限制,并且允许最大限度地利用计算资源,PBS将调用vnode。作为管理员,可能会要求您将计算资源分配或限制给特定的用户、组或项目。另一个常见的问题是用户需要为特殊项目提供专用的计算资源。PBS Professional提供了许多分配和限制资源的方法。在本文档中,我们将描述使用队列和自定义资源来满足需求的两种常见方法。

技术论文,白皮书
集成Enroot与Altair PBS专业

集成Enroot与Altair PBS专业

Altair PBS Professional是一款快速、强大的工作负载管理器,旨在提高生产率、优化利用率和效率,并简化集群、云和超级计算机的管理——从最大的HPC工作负载到数以百万计的小型、高吞吐量作业。PBS Professional可以与Docker、Singularity和Enroot等流行的容器技术集成。在本文中,我们将重点介绍PBS Professional与Enroot的集成,这是一个简单但功能强大的工具,可以将传统的容器/操作系统映像转换为非特权的沙箱。

技术论文,白皮书
使用CentOS或SLES构建PBS专业虚拟测试集群

使用CentOS或SLES构建PBS专业虚拟测试集群

因为在生产环境中探索软件并不总是很方便,Altair PBS Professional具有许多特性,允许用户在相对简单、廉价的硬件上模拟大型计算节点环境。本文档解释了如何使用CentOS或SLES设置虚拟测试集群。

技术论文,白皮书
用Ubuntu构建PBS专业虚拟测试集群

用Ubuntu构建PBS专业虚拟测试集群

因为在生产环境中探索软件并不总是很方便,Altair PBS Professional具有许多特性,允许用户在相对简单、廉价的硬件上模拟大型计算节点环境。这个文档解释了如何用Ubuntu建立一个虚拟测试集群。

技术论文,白皮书
有问题吗?如果您需要以上提供的帮助,请联系我们