ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Целью исследования является изучение важности входных признаков, используемых для построения моделей машинного обучения, прогнозирующих состояние магнитосферы. В качестве прогнозируемых значений рассматриваются среднечасовые значения экваториального индекса Dst на 1-4 часа вперед [1]. В качестве входных признаков используются исторические значения характеристик солнечного ветра и межпланетного магнитного поля из первой точки Лагранжа в система Солнце-Земля и индекса Dst, а также временные характеристики, описывающие положение Земли относительно Солнца. Каждый параметр, кроме временных характеристик, описывается 25 среднечасовыми значениями: текущим и 24 историческими значениями за час до текущего, два часа до текущего и так далее. Для оценки важности входных признаков использовался итеративный подход на основе алгоритмома машинного обучения, связанный с перебором моделей-кандидатов путём удаления входных признаков по одному. В данной работе в качестве алгоритма машинного обучения рассматривается линейная регрессия. Общая схема работы алгоритма выглядит следующим образом: 1) Обучается модель машинного обучения на данных с полным набором из n входных признаков, и производится оценка качества модели на тестовом наборе. 2) Каждый признак по очереди удаляется из набора данных. 3) На каждом из n уменьшенных наборов производится обучение модели машинного обучения, и производится оценка изменения точности по сравнению с моделью, полученной на шаге 1. 4) Признак, удаление которого приводило к минимальному падению качества по сравнению с остальными моделями, полученными на шаге 3, полностью удаляется из набора. 5) Повторяем алгоритм, начиная с шага 1, используя полученный на шаге 4 набор в качестве полного. Повторяем до тех пор, пока не останется последний признак. 6) Считается, что признаки ранжированы по важности в порядке, обратном порядку удаления: самый важный признак остается последним. По результатам работы наиболее важными оказались следующие признаки: Dst(0), B_z(1), H_den(0), B_magn(1), H_den(3), SW_spd(2), где Dst – значение индекса Dst, B_z и B_magn – значения z-компоненты и модуля межпланетного магнитного поля, соответственно, H_den – плотность протонов в солнечном ветре, SW_spd – скорость солнечного ветра, в скобках указана задержка в часах относительно текущего момента. В работе проводится анализ и обсуждение результатов и перспектив использования алгоритма для задач прогнозирования состояния магнитосферы Земли. 1. Ефиторов А.О., Мягкова И.Н., Широкий В.Р., Доленко С.А. Прогнозирование Dst-индекса, основанное на методах машинного обучения. Космические исследования, 2018, т.56, №6, с.353-364.