ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Программный модуль реализован в виде независимого приложения, которое использует программную платформу распределенной обработки данных Apache Spark (в частности, методы машинного обучения) в среде распределенной файловой системы HDFS (Hadoop Distributed File System). Данный модуль отвечает за создание модели зависимости (на основе методов машинного обучения) для тренировочной выборки данных (которые являются описанием вычислительных заданий, запущенных в системе автоматизированного запуска исполняемых заданий в ГРИД-инфраструктуре), определение функционала качества (описывает степень настройки модели и точности прогнозирования) с использованием тестовой выборки данных, и применение модели для генерации предсказаний длительности выполнения новых запущенных заданий. Конфигурирование модуля позволяет определить рабочую выборку данных и соответствующие ключевые атрибуты, а также настроить параметры модели.