工作负荷编排是人工智能和机器学习的关键
机器学习(ML)和人工智能(AI)是当今技术景观的很大一部分。毫无疑问,他们是热门话题,他们将在下周议程SC19,Premier Global Supercomputing会议。组织处于应用AI和ML的各个阶段,但许多人已经通过解决现实世界问题对业务,发现和创新产生重大影响。
Altair客户已经在医疗保健,零售,政府,金融服务中使用ML。它对一系列任务有用,包括营销分析,欺诈检测和人口增长分析。Altair知识工程™包括数据准备,数据科学,预测分析和流式可视化的解决方案。它可以合并用于提供预测维护和数字双胞胎的创建的历史和实时数据。
一位保险客户每年使用知识效果为模型异常和确定欺诈性索赔,每年节省1500万美元。零售商改善了其营销反应,并确定了理想的客户,导致另外1500万美元获胜。此外,金融客户增加了每年2400万美元的债务付款金额,使用ML具有知识作品。
除了追求使用AI和ML来解决真正的问题之外,今天的技术气候有两个增长范围:使用HPC解决方案来改善ML并使用ML改善HPC解决方案。
使用HPC解决方案来提高机器学习
培训ML模型是资源密集型的,需要强大的HPC。强度准确性和高保真是强制性的。ML使用模式来模拟问题并消耗大量数据,导致巨大的输入和输出。工作负载管理是组织的基本技术,因为它们试图提供和管理为其ML和AI举措提供支持的HPC资源。
由于云计算,GPU和新的ML框架等技术的进步,AI和ML比以往任何时候都更加强大,可访问广泛的受众。Altair帮助客户导航这些新技术的融合。
我们的客户使用Altair PBS Works™通过平台提交ML工作,如Tensorflow,因为GPU优化,这可能是由于我们与NVIDIA的强有力的合作关系。客户还在容器(如Kubernetes)之间的HPC工作负载,大数据工作负载(Spark)和云之间。
使用机器学习改善HPC解决方案
HPC不仅可以使ML成为可能,ML可以使HPC解决方案更有效。
几十年来,Altair的工作负载管理和作业调度解决方案有效地找到了作业的合适资源,使其成为HPC用户的必备条件。使用正确的ML模型,我们帮助组织使用数百万个自己的数据。考虑到多长时间,多长时间,以及对特定的资源和培训工作负载管理器和作业调度程序的准确作业如何更有效地将HPC作业分配给硬件。
此建模有助于确定购买许可证,节点,内存和GPU的最佳资源。这也比较了云成本并答案工作时间相关的用户问题。它规定了与效率相关的工作的最佳资源,解决方案,利用,功耗和成本。它预测执行时间以改善弹性调度和抢先维护的利用率和故障。它还预测I / O模式以减轻文件系统级别和网络上的拥塞,以及用户模式,以在最佳时间内主动提供正确的资源。
在今年最大的超级计算会议上了解更多信息
了解有关2019年11月19日在SC19的关于ML和AI的Altair工作负荷管理解决方案的更多信息Altair PBS Works CTO,Bill Nitzberg将在我们的展位上展示“HPC用于人工智能和机器学习”(#1319) at 12 p.m.