
Разработано программное обеспечение для компьютерной системы распознавания авторов текстов
18.02.2025 /
В настоящее время все большее число исследований по обработке текстов, написанных на естественном языке, способствует решению актуальных проблем в этой области. Одним из таких направлений является деление текстов на категории. Тексты можно разделить на различные категории в зависимости от тематики, сентиментальности и стиля письма. Категоризация текстов по стилям письма широко используется для определения жанров документов и распознавания авторов текстов. Выявление авторов текстов осуществляется на основе количественного анализа стилей письма авторов текстов – стилистики письма.
В эти исследования, проводимые в мировом масштабе, вносят свой вклад различные научные учреждения Азербайджана, в том числе ученые Института систем управления (ИСУ) Министерства науки и образования Азербайджанской Республики. Одним из важных научных результатов, полученных в институте за 2024 год, стала работа «Разработка программного обеспечения на основе математических моделей с использованием различных методов машинного обучения – искусственных нейронных сетей, методов опорных векторов – для компьютерной системы распознавания авторства текстов», выполненная сотрудниками лаборатории «Методы распознавания, идентификации и принятия оптимальных решений» под руководством члена-корреспондента НАНА, профессора Камиля Айда-заде, научного сотрудника Рустама Азимова, д.ф.т., доцента Эльшана Мустафаева и инженера-программиста Соны Рзаевой. Основной целью исследования является изучение вопросов распознавания авторов текстов на азербайджанском языке, разработка алгоритмов решения и компьютерной системы.
Анализ авторства текстов широко применяется для установления автора анонимного или оспариваемого произведения искусства (особенно в судебных разбирательствах по авторским правам), проверки подлинности предсмертных писем, в разведывательных целях (например, для определения того, были ли анонимные сообщения или заявления написаны известным лицом), для установления автора вредоносных компьютерных программ (например, компьютерных вирусов), а также для установления авторов некоторых текстов в Интернете (электронных писем, сообщений в блогах, текстов на страницах интернет-форумов).
Использованные в исследовании программные модули для структурной и параметрической идентификации искусственных нейронных сетей и полученные результаты были использованы для усовершенствования прикладного программного пакета «Система распознавания форм» в Государственном экзаменационном центре Азербайджанской Республики. Результаты работы опубликованы в 2 импакт-факторных журналах, входящих в базу данных Web of Science, и 3 журналах, входящих в базу данных Scopus.


