Описание:Курс предназначен для студентов бакалавриата как вводный в проблематику автоматической обработки неструктурированных данных разного вида: текстов на естественном языке, изображений, речевых сигналов и др. Изучаются базовые методы и средства обработки текстовых данных, включая статистический анализ единиц текста и статистические языковые модели. Обзорно рассматриваются методы машинного обучения для анализа неструктурированных данных, в том числе традиционные методы и нейронные сети. Рассмотренные методы иллюстрируются примерами их применения для решения прикладных задач обработки текстов и изображений.