2021-06-14 11:10:18
Продолжая тему дней рождений. Сегодня 165 лет со дня рождения Андрея Андреевича Маркова (старшего, 02(14).06.1856 — 20.07.1922).
Очень интересная и глубокая тема, связанная с его работами – тройки (числа) Маркова:
лекция «Магия марковских троек» Александра Петровича Веселова;
лекция «Числа Маркова в арифметике и геометрии» Юрия Геннадьевича Прохорова .
А мы сегодня вспомним про историю, связанную с понятием цепи Маркова.
Андрей Андреевич изучил распределение гласных и согласных в последовательности из 20 000 букв в романе «Евгений Онегин» (первая глава и начало второй). Основной вывод гласил: «Мы видим, что вероятность букве быть гласной значительно изменяется, в зависимости от того, предшествует ей гласная или согласная». Подсчёты А. А. Маркова показали, что общая доля гласных — 43,2%, но вероятность встретить гласную после гласной уменьшается до 12,8%, а после согласной — возрастает до 66,3%.
Как цепи Маркова работают в современных компьютерах и телефонах для определения языка текста и исправления опечаток отлично изложено в статье Александра Пиперски «Статистика языка» https://book.etudes.ru/toc/langstat/. Там же, в списке литературы, приведены pdf-файлы статей Маркова 1913 и 1916 годов про его исследования текста Евгения Онегина.
В посте в ВК
https://vk.com/etudesru?w=wall-192547232_2863
выложим в открытый доступ скан рукописи А.А. Маркова с подсчётом количества гласных и согласных в тексте Евгения Онегина.
В качестве «бонуса» — черновик статьи Владимира Андреевича Успенского с оценкой этого исследования. Сама статья была опубликована на немецком языке в сборнике «Andrej A. Markov. Berechenbare Künste» в 2007 году. Владимир Андреевич рассказывал историю, что участвовать в конференции он согласился только при условии, что они опубликуют сканы рукописи Маркова и это была их первая публикация. К сожалению, при этом оригинал куда-то «ушёл» из библиотеки.
534 views08:10