Получи случайную криптовалюту за регистрацию!

Аномалии в данных. Аномалии, или 'выбросы' - это значительны | Красивая аналитика / HR

Аномалии в данных.

Аномалии, или "выбросы" - это значительные отклонения от тренда.

Причины аномалий могут быть:

* ошибки в данных, и тогда надо искать причину и устранять ее в источнике данных.
* объективные внешние причины, и тогда это инсайты, которые нам очень интересны.

Далее тему поясняет мой коллега, hr-аналитик, Артемий Молоснов. 

Аномалия может быть:

* в каком-то конкретном месте, или аномалия относительно контекста. Например, рост текучести сразу после выплаты годового бонуса.
* в нескольких показателях сразу – текучесть, отказы от офферов и зарплатные ожидания на конкретную позицию. Например, вышла какая-то негативная новость о нашей компании и брэнд работодателя резко пошел вниз.

Методы выявления (детектирования) аномалий могут быть:

* визуальные (осмотр ряда данных, графиков и диаграмм, условное форматирование)
* статистические (например, через стандартное отклонение, разницу между процентилями и т.п.)
* машинное обучение (метод DBSCAN и подобное)

* Продолжение следует...