牵牛星网格引擎高级培训2021
功能和命令的详细方面
在线直播互动培训 |
从2021年11月16日星期二开始,中欧时间10点 |
持续时间 |
每天4小时,周二至周四,持续两周 |
价格 |
每人2500欧元 |
课程概述
本课程旨在扩展系统管理员和最终用户的知识,包括Grid Engine的功能和命令的详细方面。该课程允许管理员将业务目标转换为Grid Engine配置,并允许高级终端用户创建工作流,以有效地使用工作负载管理系统。
这个类提供了收集站点定义的共享资源的宝贵经验,比如许可证,作业提交和执行环境的配置,经典的和容器化的工作负载(例如Docker), GPU管理,动态集群配置等等。
实践练习被整合进课程以及实际的问题解决技巧。
谁应该参加课程?
本高级课程是为系统管理员和高级终端用户设计的,他们负责在站点定义的集群资源管理中扩展Grid Engine的角色,并要求实现作业和资源控制。
课程内容适用于所有版本的网格引擎。
先决条件
- 基本的Linux或Unix操作系统知识
- 基本Unix shell知识(如bash/csh/ksh和vi编辑器)
- 系统管理概念和并行编程模型(共享内存/分布式内存)的基本知识
- 基本的网格引擎(或类似的)管理知识或高级技能
Grid Engine用户体验是有利的,但不是必需的
顾客在说什么
培训给我们带来了许多新的见解……仅仅几周后,当我们遇到一个小问题时,我们能够立即解决它。
- Ralf Nolte, Bielefeld大学CeBiTec系统管理员
培训的好处是显著的,特别是在管理企业面临的风险方面。
- Mike Twelves,供应链解决方案,塔塔钢铁
课程大纲
- 概念回顾
- 网格引擎的概念和组件
- 高级配置
- 全局配置
- 主机配置
- 队列配置
- 负载传感器和资源
- 工作类型和环境
- 并行作业和环境
- 多线程,MPI等
- 松散与紧密的并行工作集成
- 数组的工作
- 互动的工作
- 诊断和性能调优
- 调试与故障诊断
- 高吞吐量调谐
- 数据假脱机和含义
- 调度程序配置
- 调度策略(授权策略、紧急策略和优先策略)
- 资源预留(Resource Reservation, RR)和回填
- 预约及常备预约简介
- RQS (Resource Quota Sets),用于灵活的执行限制
- 管理不同类型的工作负载
- 用于封装复杂作业提交的作业类
- 管理作业提交验证程序(jsv)
- 核心/内存绑定,Linux CGROUPS
- 管理图形处理器和NVIDIA数据中心图形处理器管理器的集成
- 使用Docker与Altair网格引擎
- 提交Docker作业并请求Docker运行选项
- 问题和答案