Аннотация:В работе был программно предложен, реализован и исследован алгоритм сверточного иерархического нейросетевого классификатора. Исследована зависимость качества работы модели от порога по доле проголосовавших примеров и порога по активациям. Предложен метод адаптивного выбора порога по активациям в узле на основе среднего и стандартного отклонения значений выходных активаций сети в узле.
Для тестирования сверточного иерархического нейросетевого классификатора и исследования зависимости от гиперпараметров была использована эталонная задача классификации изображений CIFAR-10. Дополнительно алгоритм применен к задаче CIFAR-100. Показаны примеры иерархий классов, построенные алгоритмом для двух задач.
Показана необходимость разделения обучения на две стадии. Доработка второй стадии с целью улучшения качества работы алгоритма является предметом дальнейших исследований. В частности, требуется разработка алгоритма адаптивного определения оптимальных гиперпараметров для сетей второй стадии. Показано, что увеличение порога по доле проголосовавших примеров ведет к улучшению качества работы алгоритма. Выявлено отсутствие зависимости качества работы от фиксированного порога по активациям при выборе оптимального значения порога по доле проголосовавших примеров. Для адаптивного метода выбора порога в узле выбрано оптимальное значение при оптимальном значении порога по доле проголосовавших примеров.
Новизна работы состоит в предложенном алгоритме сверточного иерархического нейросетевого классификатора на основе алгоритма иерархического нейросетевого классификатора, а также в адаптивной установке гиперпараметра классификатора, исходя из статистических соображений. Значимость работы состоит в том, что показан способ улучшения качества работы классификатора за счет выбора гиперпараметров. Практическая польза результатов состоит в том, что предложенный алгоритм позволяет уменьшить количество параметров моделей классификации. Кроме того, иерархию классов изображений, получаемую на первой стадии обучения, можно переиспользовать в других задачах с применением других алгоритмов на второй стадии, например, при обучении модели YOLO9000. Полученная программная реализация позволяет проводить дальнейшие исследования.