牵牛星网格引擎高级培训2021

功能和命令的详细方面

在线直播互动培训

从2021年11月16日星期二开始,中欧时间10点

持续时间

每天4小时,周二至周四,持续两周

价格

每人2500欧元


课程概述

本课程旨在扩展系统管理员和最终用户的知识,包括Grid Engine的功能和命令的详细方面。该课程允许管理员将业务目标转换为Grid Engine配置,并允许高级终端用户创建工作流,以有效地使用工作负载管理系统。

这个类提供了收集站点定义的共享资源的宝贵经验,比如许可证,作业提交和执行环境的配置,经典的和容器化的工作负载(例如Docker), GPU管理,动态集群配置等等。

实践练习被整合进课程以及实际的问题解决技巧。


谁应该参加课程?

本高级课程是为系统管理员和高级终端用户设计的,他们负责在站点定义的集群资源管理中扩展Grid Engine的角色,并要求实现作业和资源控制。

课程内容适用于所有版本的网格引擎。


先决条件

  • 基本的Linux或Unix操作系统知识
  • 基本Unix shell知识(如bash/csh/ksh和vi编辑器)
  • 系统管理概念和并行编程模型(共享内存/分布式内存)的基本知识
  • 基本的网格引擎(或类似的)管理知识或高级技能
    Grid Engine用户体验是有利的,但不是必需的

顾客在说什么

培训给我们带来了许多新的见解……仅仅几周后,当我们遇到一个小问题时,我们能够立即解决它。

- Ralf Nolte, Bielefeld大学CeBiTec系统管理员

培训的好处是显著的,特别是在管理企业面临的风险方面。

- Mike Twelves,供应链解决方案,塔塔钢铁


课程大纲

  • 概念回顾
  • 网格引擎的概念和组件
  • 高级配置
  • 全局配置
  • 主机配置
  • 队列配置
  • 负载传感器和资源
  • 工作类型和环境
  • 并行作业和环境
  • 多线程,MPI等
  • 松散与紧密的并行工作集成
  • 数组的工作
  • 互动的工作
  • 诊断和性能调优
  • 调试与故障诊断
  • 高吞吐量调谐
  • 数据假脱机和含义
  • 调度程序配置
  • 调度策略(授权策略、紧急策略和优先策略)
  • 资源预留(Resource Reservation, RR)和回填
  • 预约及常备预约简介
  • RQS (Resource Quota Sets),用于灵活的执行限制
  • 管理不同类型的工作负载
  • 用于封装复杂作业提交的作业类
  • 管理作业提交验证程序(jsv)
  • 核心/内存绑定,Linux CGROUPS
  • 管理图形处理器和NVIDIA数据中心图形处理器管理器的集成
  • 使用Docker与Altair网格引擎
  • 提交Docker作业并请求Docker运行选项
  • 问题和答案

保存您的位置!