ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Целью диссертационной работы является разработка библиотеки тематического моделирования для построения моделей больших текстовых коллекций с возможностью гибкой настройки процесса обучения. Для достижения этой цели в диссертации решается следующий набор задач. 1. Разработка более эффективной версии онлайнового EM-алгоритма для обучения моделей ARTM. 2. Оптимизация программных реализаций алгоритмов для работы с разреженными тематическими моделями. 3. Повышение скорости тематического моделирования и итогового качества моделей путём оптимизации алгоритма за счёт модификации решаемой оптимизационной задачи. 4. Разработка моделей для извлечения из текстовых коллекций информации по заданной тематике. 5. Реализация методов повышения качества работы с данными транзакционной природы в тематических моделях.