Аннотация:Задачей данной работы является
- Изучить принципы работы классических систем обнаружения заимствований,работающих в рамках одного языка, а также различные подходы к выявлению межъязыковых заимствований, методы и алгоритмы их работы для выделения эффективных методов;
- Рассмотреть, выбрать и модифицировать методы, оценивающие близость текстов в рамках одного языка, для оценки близости текстов на разных языках, провести эксперименты, сравнивающие эти методы, а также провести анализ полученных результатов;
- На основе метода, показавшего наилучший результат, разработать систему, которая будет определять для поданного на вход текста, какой процент предложений составляют оригинальную часть текста и какие предложения являются заимствованными.