Разработка среды выполнения для вычислений управляемых потоками данных на вычислительных кластерах с учетом особенностей коммуникационной средыдипломная работа (Специалист)
Аннотация:Современные вычислительные кластеры содержат десятки тысяч узлов, связанных коммуникационной средой. Учёт особенностей данной коммуникационной среды исполняющейся параллельной программой необходим с целью минимизации времени её работы и более полного использования ресурсов вычислительного кластера. Однако это требует либо длительного предварительного тестирования, либо сбора информации в процессе работы, что вносит накладные расходы. Тонкий учёт особенностей коммуникационной среды особенно важен для вычислений, управляемых потоками данных.
В дипломной работе Криволуцким А. А. предлагается метод тестирования коммуникаций в процессе выполнения параллельной программы, причём накладные расходы на «паразитный трафик» перекрываются выигрышем от более тонкого учёта задержек при передаче данных. Криволуцкий А. А. модифицировал подсистему времени запуска в программе на языке программирования PARUS. Предложенный подход исследован на модельном примере «вычисление по двоичному дереву» и реальному примеру «перемножение разреженных вещественных матриц». Апробация проводилась на вычислительных кластерах МГУ имени М. В. Ломоносова «BlueGene/P» и «Ломоносов». Показано сокращение времени работы на 11% по сравнению с реализацией изначально присутствующей в PARUS, где используются сведения о коммуникациях, полученные с помощью тестирования, произведённого сильно заранее – до запуска параллельной программы.