Аннотация:Выпускная работа посвящена разработке математической модели и метода распознавания букв по цифровым изображениям на основе общего эскизного описания алфавита в виде графем. Целью является создание алгоритма, способного подобно грамотному человеку читать текст, написанный любым, в том числе совершенно незнакомым шрифтом. Тема распознавания текста в цифровых изображениях документов остается актуальной в силу большого разнообразия конкретных приложений, а также в связи с развитием теории и методов создания интеллектуальных систем.
В работе исследуется подход к описанию графем в виде простых геометрических графов, отражающих базовые свойства букв: «О» - это кружок, «А» - два косых штриха и один горизонтальный и т.п. Предложен метод получения таких описаний на основе какого-либо начертания кириллического шрифта и последующего выделения и идентификации графем в изображениях произвольных шрифтов. Метод основан на построении непрерывных скелетов изображений букв и поиске в них подграфов, имеющих сходство с эталонным описанием графем.
Проведенное исследование подтверждает возможность распознавания текста на основе «графемного» представления. Реализация модели и метода позволили оценить работоспособность и эффективность такого решения на материале большой библиотеки кириллических шрифтов. Предложенный метод обоснован теоретически и проверен на реальных данных. Автором разработано программное обеспечение для проведения всего процесса исследований.