Аннотация:1. Были изучены метрики автоматической оценки качества парафраз, такие как BertScore, BLEU, косинусная близость между векторами текстов и перплексия.
2. Исследованы существующие методы перефразирования текста, такие как перефразирование с помощью синонимов, Seq2Sec модели, языковой модели, переводчика и лексической замены. Проведено сравнение разных моделей перефразирования. Лучшие результаты показала модель, основанная на переводе.
3. Исследована целесообразность использования парафразов для аугментации текстовых данных при решении задач машинного обучения. Эксперименты показали, что приросты качества от такой аугментации достаточно малы.
4. Обучена собственная модель для перефразирования текстов на русском языке, которая показывает результаты, сравнимые с аналогами.