Аннотация:Рассматривается задача классификации изображений, сопровождающих новостные сообщения, с целью автоматического выбора наиболее информативных для улучшения состава визуального ряда.
Актуальность задачи определяется тем, что в архивах новостных документов анализ изображений, относящихся к событию, может дать новое нетривиальное знание. Однако, многие источники информации иллюстрируют новости не событийными фотографиями (относящимися к данному событию), но бессодержательными изображениями – например, вывесками, внешним видом здания упоминаемого ведомства и т.п.
Была поставлена задача определения «событийных» изображений. Основными учитываемыми факторами рассматривались возможность выявления наличия объектов нескольких классов и учет лексики текста новости.
Создана, по сути, профессиональную полнофункциональную систему, решающую данную задачу.
В качестве основы была взята свободно доступная система анализа изображений компании Google, использующая нейронную сеть. Применяя методологию переноса обучения, вместо нескольких последних слоев исходной нейронной сети решалась новая задача машинного обучения для новых классов объектов. При этом альтернативно рассматривались метод на основе градиентного бустинга, логистической регрессии и другой нейронной сети. Тестирование проводилось на известных коллекциях размеченных изображений CIFAR-10 и PASCAL VOC2012. Лучшие результаты были получены с использованием нейронной сети.
Для выявления событийных фотографий была создана и самостоятельно размечена тестовая коллекция более 4000 изображений.
Была сформирована синтетическая нейронная сеть, которая учитывала как факторы наличия на изображении объектов исследуемых классов, так и факторы частотного анализа текстов, тем самым добавляя факторы взаимосвязи текстовой информации и объектов на изображении.
Получены многообещающие результаты по возможности определения событийной фотографии, причем учет текстовой информации улучшает качество классификации.