2022-07-12 21:59:37
Русско-армянский антиплагиат
Институт системного программирования РАН начинает совместный проект с Российско-Армянским университетом (РАУ) и компанией «Антиплагиат». Он посвящен разработке методов автоматического обнаружения заимствований в текстовых документах на разных языках, включая русский и армянский. В настоящее время формируется заявка на грант в Министерство науки и высшего образования РФ.
Проект уже получил поддержку консорциума, созданного в 2021 году для долгосрочного развития Национальной цифровой лингвистической платформы Армении и объединившего шесть научно-образовательных организаций страны: это Государственный университет им. В.Я. Брюсова, Ереванский государственный университет, ВАК Республики Армения, Армянский государственный экономический университет, Национальная библиотека Армении и Ереванский государственный медицинский университет имени Мхитара Гераци. На заседании в Ереване их представители составили и подписали письмо поддержки в Минобрнауки.
В рамках реализации проекта планируется создать комплексное описание западного и восточного армянских языков, а также обучающей платформы на русском и армянском. В работе будут использованы глубокие нейросетевые модели, которые помогут более точно проводить детальный анализ текстов; предполагается также разработать универсальные методы анализа для расширения круга поддерживаемых языков.
У ИСП РАН уже есть обширный опыт в области разработки технологий для лингвистических исследований, в том числе совместно с РАУ. В частности, для реализации нового проекта планируется использовать базовую платформу выявления заимствований в армянских текстах (Sieve), а также платформу сбора и анализа языковых материалов Lingvodoc, которая применяется в России филологами из более 30 вузов и НИИ.
Директор ИСП РАН, академик Арутюн Аветисян, для НОП:
Результаты, полученные нашей совместной командой с РАУ, оказались на очень высоком научно-технологическом уровне. Именно поэтому проектом заинтересовались создатели такой известной системы, как «Антиплагиат», в результате чего мы совместно приняли решение подать общую заявку на грант. Со стороны Армении планируем привлечь лингвистов, которые соберут качественные корпуса армянского языка и смогут содействовать долгосрочному развитию создаваемых технологий межъязыкового антиплагиата.
Председатель ВАК Армении Карен Керян для НОП:
Внедрение и широкое распространение платформы Sieve для выявления заимствований в текстовых документах на армянском языке поставят на новый уровень техническую оценку диссертаций, а также дадут возможность выявления заимствований в статьях и даже в дипломных работах. Это поможет студентам уделять больше внимания вопросам академической добросовестности и этики.
Директор библиотеки Государственного университета имени В.Я. Брюсова Лиана Сафарян для НОП:
Совместный проект ИСП РАН и РАУ нацелен на разработку программного обеспечения, способствующего наиболее эффективному обнаружению межъязыковых заимствований как в научно-технических работах, так и в художественных текстах. В качестве представителя Брюсовского университета я полагаю, что мы сможем использовать потенциал нашего вуза в контексте предоставления всесторонней помощи в реализации данного проекта.
Также в рамках заседания был подписан договор об использовании платформы Sieve компанией «Варданян дизайн студио», которая будет внедрять ее в работу научно-образовательных организаций, входящих в консорциум.
Институт системного программирования становится одним из ключевых игроков в цифровой лингвистике. Помимо вопросов антиплагиата и сохранения языков лингвистические платформы способны дать дополнительный импульс машинному переводу, который по качеству в ряде областей уже приближается к сделанному человеком.
138 views18:59