Реляционный подход к распознаванию: теория и практика - НИР | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Руководитель НИР: Гуров С.И.
Участники НИР: Ветров Д.П., Колмаков Е.А., Майсурадзе А.И., Подоприхин Д.А.
Подразделение: Кафедра математических методов прогнозирования
Срок исполнения: 10 января 2013 г. - 30 декабря 2015 г.
Номер договора (контракта, соглашения): 13-01-00751-а
Номер ЦИТИС: 01201356238
Тип: Фундаментальная
Приоритетное направление научных исследований: Математическая кибернетика, математические методы прогнозирования и исследование операций
ПН России: Информационно-телекоммуникационные системы
Направление технологического прорыва России: Стратегические информационные технологии
Рубрики ГРНТИ:
- 27.17.21 Структуры
- 28.23.15 Распознавание образов. Обработка изображений
- 28.23.27 Интеллектуальные робототехнические системы
Ключевые слова: реляционная теория, надёжность распознавания, распознавание образов
Описание:
В рамках проекта будет развито новое направления в теории распознавания образов – т.н. реляционный подход (РП). Сущность методов распознавания на базе РП – анализ описания объектов и формирование подходящего признакового пространства с учетом имеющихся информации о классах. При этом учитываются связи и отображения между множествами объектов и признаков. Наиболее известное и разработанное направление в рамках РП – анализ формальных понятий, однако разработанные в ходе реализации проекта методы не будут находиться исключительно в его рамках. Предлагаемый РП включает в себя группу методов, базирующихся на теории отношений, решёток, частично упорядоченных множеств, начало изучения которых было начато в работах отечественных и зарубежных учёных ещё в прошлом веке и продолжается в настоящее время. На основе разработанных методов в рамках РП будут созданы алгоритмы распознавания и решены ряд задач (из областей экономики, биоинформатики и др.), неудовлетворительно решаемых традиционными методами, проведены исследования в области т.н. глубинного обучения - нового подхода к генерации признаковых описаний объектов, будет решена задача сегментации выделения объекта на зашумленном изображении с учетом априорных представлений о вариабельности формы объекта. Также будут развиты методы оценки надёжности разработанных алгоритмов, основанные на предложенной при выполнении предыдущих проектов (поддержанных РФФИ) информационной модели алгоритмов классификации.
Основные результаты:
В результате выполнения проекта построен оригинальный подход использования метрической информации в применении метода анализа формальных понятий (АФП) для задач распознавания образов. Подход объединяет идеи связи объект-признак, лежащие в основе АФП и метрические методы распознавания образов. Также был предложен метод оценки компактности и разделимости объектов из разных классов в случае классификации на два класса с применением методов АФП. Предложенный метод протестирован на нескольких задачах с реальными данными. В 2014 г. проведено исследование различных архитектур глубинных нейронных сетей применительно к следующим задачам обработки данных: 1. моделирование распределений на бинарную и многоклассовую форму двухмерного объекта; 2. семантическая сегментация изображений; 3. построение семантических представлений слов. Исследовались архитектуры на основе ограниченных машин Больцмана и их специального случая больцмановских машин формы, свѐрточных сетей, скипграмм; в результате было установлено, что сверточные сети, в целом, обладают рядом преимуществ перед другими архитектурами, особенно в задачах, связанных с обработкой изображений. Также велись работы по разработки и реализации алгоритмов для BCI-интерфейсов с использованием доступного коммерческого устройства Emotiv (см. рис. 1). В ходе исследований был предложен способ формирования признакового пространства для решения задачи идентификации направления курсора с использованием BCI, построены алгоритмы фильтрации артефактов, связанных с неинформативными движениями человека и проведено их сравнение с использующемся в большинстве BCI методом, основанном на анализе спектральной характеристики сигнала. Принцип верификации сложных моделей путѐм проверки полноты описания данных с помощью простых моделей, был распространѐн на кусочно-линейные или полиномиальные регрессионные модели. Данный принцип основан на использовании перестановочных тестов и включает верификацию сложных моделей относительно простых моделей, полученных с помощью метода наименьших квадратов, моделей, наименее удалѐнных от верифицируемой сложной. В теоретических исследованиях обоснования метода поиска оптимальных выпуклых комбинаций предикторов в качестве целевого функционала был принят коэффициент корреляции с прогнозируемой величиной и было строго доказано, что максимальное значение целевого функционала обязательно достигается для выпуклой комбинации, в которой все предикторы со строго положительными коэффициентами образуют несократимый и нерасширяемый набор. При изучении метрик на объектах распознавания без учителя (указанная задача сводится к задаче наилучшего восстановления исходных данных) доказано, что дополнительные метрические ограничения не снижают качество восстановления информации. Предложен подход, в котором задача обучения линейной комбинации метрик на размеченной выборке сводится к задаче линейного программирования, показано, что данная задача всегда разрешима, если в выборке нет противоречивых объектов.
Добавил в систему: Гуров Сергей Исаевич

Соисполнители НИР

МГУ имени М.В.Ломоносова

Координатор

Источник финансирования НИР

грант РФФИ

Этапы НИР

#	Сроки	Название
1	10 января 2013 г.-31 декабря 2013 г.	Реляционный подход к распознаванию: теория и практика
Результаты этапа:
2	1 января 2014 г.-31 декабря 2014 г.	Реляционный подход к распознаванию: теория и практика
Результаты этапа: За 2014 г. По направлению разработки методов реляционной теории распознавания построен оригинальный подход использования метрической информации в применении метода анализа формальных понятий (АФП) для задач распознавания образов. Необходимость его построения вызвана тем, что обычные подходы на основе АФП требуют бинарного описания данных, что является серьѐзным ограничением. Для того, чтобы обойти данное ограничение обычно применяют процедуру шкалирования данных (такой подход, однако, влечѐт потерю информации) или используют т.н. узорные структуры, которые являются обобщением понятия формального контекста. Предложенный подход объединяет идеи связи объект-признак, лежащие в основе АФП и метрические методы распознавания образов, т.е. для классификации совместно используется информация из исходного признакового пространства и объектно-признаковые зависимости из решѐтки формальных понятий. Подход использует метод опорных векторов и имеет сходство с аналогичным, применяемым в алгоритмах вычисления оценок в теории распознавания образов. В рамках описываемого подхода также рассматривается семейство псевдометрик, определяемое на любой конечной решѐтке с указанием параметров, при которых введѐнная псевдометрика имеет интерпретацию в терминах АФП. Указанная метрика используется для модификации известных алгоритмов классификации на базе АФП-подхода и (с целью увеличения обобщающей способности получаемых классификаторов) для уменьшения размера системы опорных понятий. Также был предложен метод оценки компактности и разделимости объектов из разных классов в случае классификации на два класса с применением методов АФП. Предложенный метод протестирован на нескольких задачах с реальными данными. По направлению изучения областей применимости различных глубинных архитектур в задачах машинного обучения проведено исследование различных архитектур глубинных нейронных сетей применительно к следующим задачам обработки данных: (1) моделирование распределений на бинарную и многоклассовую форму двухмерного объекта; (2) семантическая сегментация изображений; (3) построение семантических представлений слов. Исследовались архитектуры на основе ограниченных машин Больцмана и их специального случая больцмановских машин формы, свѐрточных сетей, скипграмм. В ходе экспериментов установлено, что сверточные сети, в целом, обладают рядом преимуществ перед другими архитектурами, особенно в задачах, связанных с обработкой изображений. Разработаны методические подходы к обучению комбинированных глубинных архитектур и обучению по не полностью размеченным данным. По направлению создания методов нейрокомпьютерного интерфейса (BCI) в отчѐтном периоде велись работы по разработки и реализации алгоритмов для BCI-интерфейсов с использованием доступного коммерческого устройства Emotiv EPOC (нейроинтерфейсное устройство, основанное на ЭЭГ и получившее широкое распространение за пределами медицинских учреждений). Однако ограниченное количество электродов и низкое качество сигнала данного устройства съѐма данных усложняет применение стандартных методов, используемых при построении BCI систем. В результате для многих методов необходимо заново разрабатывать алгоритмы исследовать ранее предложенные. По результатам работы в 2014 г. данные алгоритмы были адоптированы, в результате чего был получен их исходный код под лицензией BSD. В ходе исследований (1) был предложен способ формирования признакового пространства для решения задачи идентификации направления курсора с использованием BCI; (2) построены алгоритмы фильтрации артефактов, связанных с неинформативными движениями человека и (3) проведено их сравнение с использующемся в большинстве BCI методом, основанном на анализе спектральной характеристики сигнала. Для целей проверки качества алгоритмов обработки данных BCI, реализована игра «Лабиринт», основанная на распознавании паттернов в сигналах ЭЭГ, где в качестве управляющих сигналов использовано моргания глазами. В отличии от других методов, используемых для реализации взаимодействия человека с компьютером по средствам BCI, такие сигналы могут быть распознано с высоким качеством, а эффект, возникающий в головном мозге, слабо варьируется от человека к человеку. В плане развития данных исследований (для задела работ на 2015 г.) проводились работы по созданию элементов нейрокомпьютерного интерфейса для управления реальным динамическим объектом. Были проведены эксперименты по получению необходимых данных с помощью электроэнцифалогофа Emotiv EPOC. Также исследовались методы предобработки и фильтрации сигналов ЭЭГ. На полученных обработанных данных реализованы разработанные методы распознавания и классификации паттернов, которые позволили достичь качества распознавания до 71%, что является достаточно результатом (как известно, автоматическая обработка сигналов ЭЭГ представляет из себя одну из самых трудных задач ЦОС). По направлению работ по оптимизации сложности эмпирических закономерностей, принцип верификации сложных моделей путѐм проверки полноты описания данных с помощью простых моделей, был распространѐн на кусочно-линейные или полиномиальные регрессионные модели. Данный принцип основан на использовании перестановочных тестов и включает верификацию сложных моделей относительно простых моделей, полученных с помощью метода наименьших квадратов, моделей, наименее удалѐнных от верифицируемой сложной. Также были продолжены теоретические исследования по обоснованию метода поиска оптимальных выпуклых комбинаций предикторов. Ранее было введено понятие несократимого и нерасширяемого набора предикторов (под несократимостью понимается невозможность исключения предиктора из набора без уменьшения целевого функционала, характеризующего качество аппроксимации зависимости, а несократимый набор называется нерасширяемым, если исключение из него хотя бы одного предиктора приводит к утрате свойства несократимости). В качестве целевого функционала был принят коэффициент корреляции с прогнозируемой величиной. Было строго доказано, что максимальное значение целевого функционала обязательно достигается для выпуклой комбинации, в которой все предикторы со строго положительными коэффициентами образуют несократимый и нерасширяемый набор. Данный результат является обоснованием решения задачи поиска оптимальной выпуклой комбинации путѐм перебора всевозможных несократимых нерасширяемых наборов. По направлению обучения линейной комбинации метрик на объектах распознавания без учителя (указанная задача сводится к задаче наилучшего восстановления исходных данных) доказано, что дополнительные метрические ограничения не снижают качество восстановления информации. Поставлена и исследована задача обучения линейной комбинации метрик на размеченной выборке. Предложен подход, в котором указанная задача сводится к задаче линейного программирования. Показано, что задача всегда разрешима, если в выборке нет противоречивых объектов.
3	1 января 2015 г.-31 декабря 2015 г.	Реляционный подход к распознаванию: теория и практика
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".

	ИСТИНА	Войти в систему Регистрация
	ФНКЦ РР
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ФНКЦ РР

Реляционный подход к распознаванию: теория и практикаНИР

Соисполнители НИР

Источник финансирования НИР

Этапы НИР

Прикрепленные к НИР результаты