Получи случайную криптовалюту за регистрацию!

В России в кого ни ткни, всех зовут Александр, а бывают же стр | О словах и не только

В России в кого ни ткни, всех зовут Александр, а бывают же страны, где имена разные. Как бы это посчитать?

Возьмём большой набор данных для разных стран — имена футболистов с Transfermarkt. Очевидно, что это не про имена вообще, а про имена молодых мужчин, но пренебрежём этим перекосом ради удобства и сопоставимости и посчитаем индекс Симпсона: какова вероятность, что имена у двух случайно взятых игроков из одной страны совпадут. Чем она выше, тем меньше разнообразие? А если разделить 1 на индекс Симпсона, то получим условное количество имён для данной страны: если вероятность совпадения 0,01, то родители как бы выбирают из 100 равновероятных имён; а если 0,02, то как бы из 50 и т. п.

Выше всего разнообразие имён в Западной Европе и в Турции: там самое частотное имя не набирает и 3%. Северная Европа, Западная Африка и Южная Америка где-то посередине, а в Южной и Восточной Европе царит однообразие. Ясно, что где-то просто больше плавильный котёл национальностей, а где-то меньше, но такие сильные расхождения только этим не объяснить: значит, всё-таки есть культурные различия в практиках именования.

И, конечно же, интересно просто почитать тройки лидирующих имён (если 3-е место делят несколько имён, привожу их все): в 8 странах из 23 в топе есть Иван, а в 6 странах — Александр. Лидерство Патрика в Германии и Антони во Франции для меня было неожиданным. А вам что-нибудь бросается в глаза в этой таблице?