ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Для выявления общественного мнения используется анкетирование. Вопросы в анкетах можно разбить на две основные группы по степени свободы, предоставляемой респонденту: закрытые вопросы — вопросы, в которых респондент выбирает один или несколько вариантов ответа из предложенных составителем анкеты; открытые вопросы — вопросы, на которые респонденту предлагается дать развёрнутый ответ своими словами. Обработка ответов на закрытые вопросы сводится к хорошо исследованной задаче количественного анализа. Обработка ответов на открытые вопросы является более сложной задачей качественного анализа слабоструктурированных данных. Чтобы выявить их структуру и использовать количественные методы, проводят кодирование ответов. Работа посвящена разработке методов кодирования ответов на открытые вопросы на русском языке, их теоретическому и эмпирическому исследованию. В настоящее время в России обычно используют ручное кодирование ответов. Высокая трудоёмкость этой процедуры, необходимость тщательно согласовывать действия участников процесса кодирования для борьбы с проблемой субъективности качественного анализа — все эти трудности останавливают исследователей, ограничивают использование открытых вопросов. Целью работы было предложить и исследовать новый процесс кодирования ответов на открытые вопросы. В предлагаемом процессе проблемы ручного подхода решены за счёт визуализации результатов, возможности согласованной групповой работы, применения интеллектуальных методов анализа данных для автоматизации процесса кодирования и интерактивного подхода для построения схемы кодирования. Задача кодирования рассматривается как задача чёткой кластеризации коллекции коротких текстов. Процесс состоит из следующих этапов: лингвистическое кодирование, расчет меры сходства, первичная кластеризация, многократное взаимодействие с экспертом, многократная кластеризация с учетом экспертного мнения. Для реализации каждого этапа необходимо было провести анализ и выбор методов именно для узкой предметной области — коротких ответов на русском языке. Такой комплексный анализ проведён впервые.