Методы построения информационных систем на основе автоматизированной содержательной обработки слабоструктурированных данныхНИР

Methods for the development of information systems based on automated content processing semi-structured data

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
1 1 января 2017 г.-31 декабря 2017 г. Методы автоматизированного пополнения больших лингвистических онтологий и перечней именованных объектов по большому архиву новостных текстов
Результаты этапа: 1. Показано улучшение качества извлечения именованных сущностей при использовании дополнительных признаков на основе кластеров слов, полученных с помощью программы word2vec на большом новостном корпусе. 2. Исследованы подходы к извлечению именованных сущностей из сообщений Твиттера, связанных с исламом. 3. Исследованы методы извлечения ключевых слов из текстов с использованием нейронных сетей. Алгоритм был обучен на терминах Онтологии по естестевенным наукам и технологиям (ОЕНТ) 4. Исследованы методы интеграции лингвистических онтологий в задачу вероятностного тематического моделирования, что ведет к улучшению понятности и связности порождаемых статистических тем.
2 1 января 2018 г.-31 декабря 2018 г. Методы интеграции в тематическое представление содержания документа именованных сущностей и терминоподобных словосочетаний
Результаты этапа: 1) Разработаны алгоритмы графового представления содержания текста с использованием терминов лингвистических онтологий и именованных сущностей 2) Организация открытого тестирования по автоматическому распознаванию значений слов для русского языка. 3) Исследованы подходы дистрибутивной семантики для извлечения устойчивых словосочетаний. 4) Поставлена задача извлечения оценочных отношений из текстов. Исследованы подходы на основе машинного обучения, включая нейронные сети к данной задаче.
3 1 января 2019 г.-31 декабря 2019 г. Методы построения и анализа когнитивных схем и временных рядов, формируемых концептами лингвистических онтологий и именованными сущностями
Результаты этапа: 1) Разработаны методы формирования когнитивных схем анализа отдельных текстов с учетом как тематических (онтологических) отношений между объектами, так и дистрибутивных - по встречаемости в отдельных предложениях 2) Разработаны методы формирования когнитивных схем для выборки документов, релевантных запросу в информационно-поисковой системе 3) Разработаны методы анализа временных рядов упоминаемости текстовых объектов в документах поисковой выборки путем выявления наиболее характерных "составляющих", аналогичных XYZ-статистикам

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".