Аннотация:Рассматриваются различные признаки для извлечения именованных сущностей из текстов на русском языке, применяемые в рамках подходов на основе машинного обучения, включая признаки собственно токена (лексемы), а также словарные, контекстные, кластерные и двухэтапные признаки. Исследуется вклад каждого признака в улучшение качества извлечения именованных сущностей. В качестве метода машинного обучения в экспериментах, описанных в данной статье, используется CRF-классификатор. Сравнение вкладов признаков произведено на двух открытых коллекциях с помощью F-меры.