Получи случайную криптовалюту за регистрацию!

В политнауках не сложилось какой-то доморощенной классификации | ПДС

В политнауках не сложилось какой-то доморощенной классификации данных, но политологи активно пользуются наработками эконометристов, о которых полезно иметь базовое представление. В эконометрике обычно выделяют 4 типа данных:

Временные ряды (time series). Временными рядами называется набор наблюдений за одним объектом в разные (обычно равные) промежутки времени. Пример: число протестных мероприятий за год в Перу с 1980 по 2020 год.

Перекрёстные данные (cross-sectional data). Под этим типом данных понимают набор наблюдений за разными однородными объектами (людьми, странами, фирмами, диадами или чем-то ещё) в конкретный промежуток времени. Пример: ВВП отдельных стран Евросоюза в 2018 году.

Объединённые перекрёстные данные (pooled cross-sectional data). Такой тип данных используется для описания наблюдений за множеством объектов за несколько периодов времени. В отличие от следующего типа данных, информация об одном объекте фиксируется в рамках одного наблюдения. Пример: база данных крупных спортивных событий с 1980 по 2018 гг. В каком-то году будет N наблюдений для N событий, в следующем будут уже новые события и новые наблюдения, но структура информация сохранится.

Панельные данные (panel data/longitudinal data). Самый подробный тип данных, соединяющий временные ряды и перекрёстные данные. Панельные данные содержат наблюдения за всеми объектами за все промежутки времени. Пример: база данных международной торговли с 1990 по 2020 год.

Зачем это нужно? К сожалению, к каждому исследовательскому вопросу нужно подбирать подходящий набор данных. Чтобы изучить влияние наличия выхода к морю на объем экспорта нефти не подойдут временные ряды, а оценить эффекты глобализации на психологическое здоровье будет проблематично на перекрёстных данных. Что ещё хуже, для каждого типа данных зачастую требуется подобрать специфические методы анализа, и всё это нужно учитывать и исследователю, и аналитику.

P.S. А еще наборы данных могут быть с геопривязкой или без, её наличие иногда открывает новые горизонты для анализа.

#пдс_образовательный