Аномалии в данных. Аномалии, или "выбросы" - это значительные отклонения от тренда. Причины аномалий могут быть:* ошибки в данных, и тогда надо искать причину и устранять ее в источнике данных.
* объективные внешние причины, и тогда это инсайты, которые нам очень интересны.
Далее тему поясняет мой коллега, hr-аналитик, Артемий Молоснов.
Аномалия может быть:
*
в каком-то конкретном месте, или аномалия относительно контекста. Например, рост текучести сразу после выплаты годового бонуса.
*
в нескольких показателях сразу – текучесть, отказы от офферов и зарплатные ожидания на конкретную позицию. Например, вышла какая-то негативная новость о нашей компании и брэнд работодателя резко пошел вниз.
Методы выявления (детектирования) аномалий могут быть:
*
визуальные (осмотр ряда данных, графиков и диаграмм, условное форматирование)
*
статистические (например, через стандартное отклонение, разницу между процентилями и т.п.)
*
машинное обучение (метод DBSCAN и подобное)
*
Продолжение следует...