Фантастические новости! Мы первыми в России связали данные двух переписей разных лет (2002 и 2010).
Взяли индивидов и домохозяйства из переписи 2002 года и нашли их в данных 2010 года, чтобы посмотреть, что с ними стало (и наоборот — из 2010-го в 2002-м.)
Получилось новых датасета с двадцатипроцентными выборками по каждому году, дополненными данными из другой волны.
Связывали без ФИО и адреса через косвенные идентификаторы — дату рождения, пол и место рождения. Подробное описание процесса можно почитать здесь.
Связать таким образом удалось порядка 70% домохозяйств и 50% индивидов.
Изучать российские домохозяйства в динамике теперь существенно проще (если вы готовы работать через виртуальное рабочее место — новые датасеты доступны только в продвинутом режиме).