2024-05-07 15:58:51
Аббревиатура НКРЯ расшифровывается как «Национальный корпус русского языка»
НКРЯ – это собрание текстов на русском языке в электронной форме, в котором можно осуществлять поиск слов, словосочетаний, грамматических форм. НКРЯ был создан более 20 лет назад и существенно изменил подходы к исследованию русского языка. В данный момент НКРЯ включает самые разные русские тексты общим объемом более 2 миллиардов слов.
НКРЯ стал первым для Яндекса проектом в сфере поддержки науки и образования. Важную роль в истории НКРЯ сыграл технический директор Яндекса Илья Сегалович (1964-2013): он создал первую версию сайта Корпуса, вместе с учеными-лингвистами улучшил морфологический анализатор текстов на русском языке MyStem, использовавшийся для разметки данных корпуса.
В то же время, Корпус и ученые-лингвисты, создавшие его, играли ключевую роль в развитии технологий, связанных с языковыми процессами, что позволило усовершенствовать поиск в интернете и другие сервисы Яндекса.
Подробнее о том, как развивался НКРЯ и о его влиянии на современные технологии и культуру, вы можете узнать в специальном проекте об истории НКРЯ в «Большом городе».
20.7K views12:58