阅读论文
AWS客户希望将其机器学习(ML)工作量扩展为数十万台机器实例。他们的目标是从S3下载大型图像,包括人员和汽车,从S3到EBS存储来训练自驾驶汽车。优化和缩放存储用法是键,但在将图像写入光盘时,会创建一个瓶颈。AWS团队使用Altair Mistral™探讨了应用程序,以了解工作流程如何得到改进,结果非常值得努力。
Altair Mistral™是HPC和科学计算的主要应用监控工具。它的轻量级足以在生产中运行,但足够灵活,以确保您从内部部门HPC获得最大,并具有管理混合云的信息。它监控I / O,CPU和内存,快速定位流氓作业和存储瓶颈,并跟踪日常群中运行的内容。