Метод измерения задержек при передаче данных между графическими процессорами находящимися на разных узлах вычислительного кластерастатья
Статья опубликована в журнале из списка RSCI Web of Science
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 12 августа 2020 г.
Аннотация:В данной статье предложены и реализованы в виде программного кода принципы нагрузочного тестирования вычислительного кластера с большим количеством GPU (Graphics Processing Unit), распределенным по узлам кластера. В результате собирается информация о задержках во времени при передаче данных разного размера между всеми GPU в системе. Разработано два режима тестирования "all to all" и "one to one". В первом режиме все GPU передают данные всем GPU одновременно. Во втором режиме в один момент времени происходит передача только между двумя GPU. По результатам тестирования, полученным с вычислительного кластера К60 (ИПМ РАН), было показано, что коммутационная среда суперкомпьютера при передаче информации между GPU не является однородной не только для передачи через сеть, но и для GPU в рамках одного узла вычислительного кластера.