ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Анализ настроений часто основывается на семантической ориентации лексики положительных и отрицательных слов. Определение семантической ориентации слов необходимо для правильной оценки содержания утверждений в СМИ, Интернете, в блогах и речи. Качественные наречия, выражающие оценку, интенсивность, направление действия, важны как модификаторы основного предиката предложения. В докладе предлагается метод извлечения базового набора наречий из списка пар антонимов. Приводится модель, основанная на представлении набора синонимов из русских словарей в виде двумерного графика, и определение семантической ориентации (сентиментов) наречий относительно трех основных осей семантического дифференциала Осгуда. Оценка эффективности метода по сравнению со словарными данными показывает эффективность полученного метода. В настоящее время доступность ресурсов для обработки естественного языка (NLP) остается актуальной темой, особенно из-за отсутствия исчерпывающих семантических ресурсов, несмотря на усилия, направленные на предоставление свободно доступной русской версии WordNet. Возможность установления относительного сходства или семантического расстояния между словами и понятиями лежит в основе вычислительной лингвистики. Рассматривается измерение расстояния в синтаксической категории наречий. Этот класс слов имеет решающее значение для некоторых приложений, потому что наречия изменяют или уточняют смысл других слов (глаголов, существительных, прилагательных). Наречия представляют особый интерес для определения семантической ориентации синтагмы, содержащей основной предикат и его модификатор (наречие). Измерение семантического расстояния или сходства между английскими словами чаще всего основано на WordNet и почти исключительно на таксономических отношениях, определенных в этой базе данных. Наш подход отличается от подхода на основе WordNet и применим также к синтаксическим категориям существительных и глаголов.