Аннотация:Во многих приложениях в области графики, дизайна и взаимодействия человека с компьютером очень важно понимать, куда будут смотреть люди на конкретной сцене. Множество психологических и физиологических примеров доказывают, что наблюдатель не равномерно уделяет внимание всей входящей зрительной информации, а только фокусируется на особенных областях, называемыми фокусами внимания или салиентными областями. В тех случаях, когда нет возможности использовать устройства слежения за глазами, для предсказания областей фокуса внимания используются модели салиентности. Существует множество факторов того, на что человек обращает внимание при просмотре видео, например: яркость, контраст цветов, движение, фокус камеры, геометрические особенности, частотные характеристикикадра, глубина сцены, наличие лиц, текстов и др. На их основе построены разные модели салиентности, каждая из которых хороша для определенного набора сцен. Однако тестирование работы алгоритмов, основанных на разных моделях, выявило, что полученные карты салиентностидля одной видеопоследовательности зачастую сильно отличаются друг от друга. Для объективного сравнения и оценки качества карт салиентности использовались базы видеопоследовательностей с результатами слежения за глазами. Был проведен анализ 6тиалгоритмов сравнениямежду картой салиентности и картой слежения за глазами. Значения алгоритма, наиболее соответствующему человеческомувосприятию, были выбраны для машинного обучения на исходномкадре и построенной для него карте салиентности. Таким образом, не имея данных о слежении за глазами, разработан метод, который для каждой сценывидеопоследовательности автоматически выбираеткарту салиентности, наиболее соответствующую поведению человеческих глаз.