Получи случайную криптовалюту за регистрацию!

в лоб vs по лбу: частотность и повторяемость иероглифов в чэнъ | папа хуху

в лоб vs по лбу: частотность и повторяемость иероглифов в чэнъюях

В “Словаре чэнъюев” 成語典 от тайваньского Министерства Образования всего есть 5161 пословица. Из них 4989 чэнъюев (96.6%) состоят из 4 иероглифов. В свою очередь эти 4989 чэнъюях состоят из 2255 разных иероглифов.

Вот самые частые 20 иероглифов, которые встречаются среди 4989 чэнъюев, с основными их значениями:

不 419 нет
一 250 один/единый
心 234 сердце
之 185 его/ее/притяжательная частица
無 169 нет
風 131 ветер
人 129 человек/люди
天 124 небо
如 121 словно, как
生 98 жизнь/живой
水 93 вода
而 91 но/однако/противительный союз
自 91 из/сам
馬 83 конь
地 81 земля
氣 81 воздух/энергия/ци
花 81 цветок/цветы
目 77 глаз
言 77 речь/слово
同 75 единый/одинаковый

Подобный частотный анализ ни к чему не обязывает и не содержит, наверняка, никакой научно полезной информации, но интересно, что самым частым существительным (не частицей и не числительным) среди китайских чэнъюев, является сердце. Конечно же потому, что сердце в китайском языке это не только сердце, но и душа, помыслы, мысли.

А самыми частыми конкретными сущностями, не явлениями, не состояниями, не образами, не метафорами, не метафизическими понятиями являются: человек, вода, конь, цветы.

Я также задумался о том, что наверняка есть чэнъюи, которые состоят из одинаковых иероглифов, просто в разном порядке. И что было бы интересно их вычленить и посмотреть, меняется ли смысл пословицы при перестановке иероглифов в ней. С задачей найти такие пословицы в массиве данных легко, элегантно и гениально справился мой замечательный друг Даниил Пахомов.

И вот чемпион: 回心轉意 поворачиваться + сердце + вертеться + помыслы

Он встречается в словаре чэнъюев аж в пяти разных комбинациях:

回心轉意
心回意轉
意回心轉
轉意回心
意轉心回

При этом его смысл, на удивление, подходит к подобной непостоянности и при это не меняется ни на йоту от перестановки слагаемых: менять свое мнение.