Изучение подходов повышения эффективности работы менеджера ресурсов суперкомпьютера Simple Linux Utility for Resource Managementдипломная работа (Магистр)
Аннотация:Каждый год вместе с производительностью суперкомпьютерных комплексов по
всему миру не менее быстро растет и база пользователей подобных систем. Ресурсы этих
систем становятся все более востребованными для решения научных, промышленных,
финансовых и прочих задач разной сложности. Пользователи высокопроизводительных
кластеров имеют различные права доступа, запрашивают от одного до многих тысяч
процессоров для запуска своих задач, время выполнения которых колеблется от
нескольких секунд многих часов или даже дней. Решение задачи удовлетворения всех
запросов пользователей в режиме реального времени в рамках ограниченных мощностей
является краеугольным камнем для системных администраторов загруженных
вычислительных систем. В данной работе рассматривается задача повышения
ресурсообеспеченности
пользователей
и
удобства
администрирования
суперкомпьютерных систем путем оптимизации работы самого распространенного
менеджера ресурсов суперкомпьютера Simple Linux Utility for Resource Management
(SLURM). Проводится обзор и анализ текущих подходов, которые используются для
планирования очереди заданий штатными средствами SLURM, на примере
суперкомпьютера «Ломоносов». В работе предлагаются новый функционал для SLURM,
позволяющий более эффективно использовать процессорное время суперкомпьютерного
комплекса, и описана схема реализации его добавления в SLURM путем использования
внешнего интерфейса wiki2.