Реляционный подход к распознаванию: теория и практикаНИР

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 10 января 2013 г.-31 декабря 2013 г. Реляционный подход к распознаванию: теория и практика
Результаты этапа:
2 1 января 2014 г.-31 декабря 2014 г. Реляционный подход к распознаванию: теория и практика
Результаты этапа: За 2014 г. По направлению разработки методов реляционной теории распознавания построен оригинальный подход использования метрической информации в применении метода анализа формальных понятий (АФП) для задач распознавания образов. Необходимость его построения вызвана тем, что обычные подходы на основе АФП требуют бинарного описания данных, что является серьѐзным ограничением. Для того, чтобы обойти данное ограничение обычно применяют процедуру шкалирования данных (такой подход, однако, влечѐт потерю информации) или используют т.н. узорные структуры, которые являются обобщением понятия формального контекста. Предложенный подход объединяет идеи связи объект-признак, лежащие в основе АФП и метрические методы распознавания образов, т.е. для классификации совместно используется информация из исходного признакового пространства и объектно-признаковые зависимости из решѐтки формальных понятий. Подход использует метод опорных векторов и имеет сходство с аналогичным, применяемым в алгоритмах вычисления оценок в теории распознавания образов. В рамках описываемого подхода также рассматривается семейство псевдометрик, определяемое на любой конечной решѐтке с указанием параметров, при которых введѐнная псевдометрика имеет интерпретацию в терминах АФП. Указанная метрика используется для модификации известных алгоритмов классификации на базе АФП-подхода и (с целью увеличения обобщающей способности получаемых классификаторов) для уменьшения размера системы опорных понятий. Также был предложен метод оценки компактности и разделимости объектов из разных классов в случае классификации на два класса с применением методов АФП. Предложенный метод протестирован на нескольких задачах с реальными данными. По направлению изучения областей применимости различных глубинных архитектур в задачах машинного обучения проведено исследование различных архитектур глубинных нейронных сетей применительно к следующим задачам обработки данных: (1) моделирование распределений на бинарную и многоклассовую форму двухмерного объекта; (2) семантическая сегментация изображений; (3) построение семантических представлений слов. Исследовались архитектуры на основе ограниченных машин Больцмана и их специального случая больцмановских машин формы, свѐрточных сетей, скипграмм. В ходе экспериментов установлено, что сверточные сети, в целом, обладают рядом преимуществ перед другими архитектурами, особенно в задачах, связанных с обработкой изображений. Разработаны методические подходы к обучению комбинированных глубинных архитектур и обучению по не полностью размеченным данным. По направлению создания методов нейрокомпьютерного интерфейса (BCI) в отчѐтном периоде велись работы по разработки и реализации алгоритмов для BCI-интерфейсов с использованием доступного коммерческого устройства Emotiv EPOC (нейроинтерфейсное устройство, основанное на ЭЭГ и получившее широкое распространение за пределами медицинских учреждений). Однако ограниченное количество электродов и низкое качество сигнала данного устройства съѐма данных усложняет применение стандартных методов, используемых при построении BCI систем. В результате для многих методов необходимо заново разрабатывать алгоритмы исследовать ранее предложенные. По результатам работы в 2014 г. данные алгоритмы были адоптированы, в результате чего был получен их исходный код под лицензией BSD. В ходе исследований (1) был предложен способ формирования признакового пространства для решения задачи идентификации направления курсора с использованием BCI; (2) построены алгоритмы фильтрации артефактов, связанных с неинформативными движениями человека и (3) проведено их сравнение с использующемся в большинстве BCI методом, основанном на анализе спектральной характеристики сигнала. Для целей проверки качества алгоритмов обработки данных BCI, реализована игра «Лабиринт», основанная на распознавании паттернов в сигналах ЭЭГ, где в качестве управляющих сигналов использовано моргания глазами. В отличии от других методов, используемых для реализации взаимодействия человека с компьютером по средствам BCI, такие сигналы могут быть распознано с высоким качеством, а эффект, возникающий в головном мозге, слабо варьируется от человека к человеку. В плане развития данных исследований (для задела работ на 2015 г.) проводились работы по созданию элементов нейрокомпьютерного интерфейса для управления реальным динамическим объектом. Были проведены эксперименты по получению необходимых данных с помощью электроэнцифалогофа Emotiv EPOC. Также исследовались методы предобработки и фильтрации сигналов ЭЭГ. На полученных обработанных данных реализованы разработанные методы распознавания и классификации паттернов, которые позволили достичь качества распознавания до 71%, что является достаточно результатом (как известно, автоматическая обработка сигналов ЭЭГ представляет из себя одну из самых трудных задач ЦОС). По направлению работ по оптимизации сложности эмпирических закономерностей, принцип верификации сложных моделей путѐм проверки полноты описания данных с помощью простых моделей, был распространѐн на кусочно-линейные или полиномиальные регрессионные модели. Данный принцип основан на использовании перестановочных тестов и включает верификацию сложных моделей относительно простых моделей, полученных с помощью метода наименьших квадратов, моделей, наименее удалѐнных от верифицируемой сложной. Также были продолжены теоретические исследования по обоснованию метода поиска оптимальных выпуклых комбинаций предикторов. Ранее было введено понятие несократимого и нерасширяемого набора предикторов (под несократимостью понимается невозможность исключения предиктора из набора без уменьшения целевого функционала, характеризующего качество аппроксимации зависимости, а несократимый набор называется нерасширяемым, если исключение из него хотя бы одного предиктора приводит к утрате свойства несократимости). В качестве целевого функционала был принят коэффициент корреляции с прогнозируемой величиной. Было строго доказано, что максимальное значение целевого функционала обязательно достигается для выпуклой комбинации, в которой все предикторы со строго положительными коэффициентами образуют несократимый и нерасширяемый набор. Данный результат является обоснованием решения задачи поиска оптимальной выпуклой комбинации путѐм перебора всевозможных несократимых нерасширяемых наборов. По направлению обучения линейной комбинации метрик на объектах распознавания без учителя (указанная задача сводится к задаче наилучшего восстановления исходных данных) доказано, что дополнительные метрические ограничения не снижают качество восстановления информации. Поставлена и исследована задача обучения линейной комбинации метрик на размеченной выборке. Предложен подход, в котором указанная задача сводится к задаче линейного программирования. Показано, что задача всегда разрешима, если в выборке нет противоречивых объектов.
3 1 января 2015 г.-31 декабря 2015 г. Реляционный подход к распознаванию: теория и практика
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".