1. Какая есть особенность у модели градиентного бустинга (и др | Я – ДЖУН, Я ТАК ВИЖУ🤓

1. Какая есть особенность у модели градиентного бустинга (и др. деревянных моделей) при работе с временным рядом.
2. Какие лаги временного ряда нужно брать при прогнозировании на несколько шагов вперед (допустим на 6 мес - 6 шагов).
3. Для каких моделей нужна нормализация для каких нет.
4. Нужна ли нормализация данных при кластеризации.

1. Не прокатит прогнозирование нестационарного ряда, конкретно, с трендом - деревянные модели не выдадут результат, отличный диапазона в обучающей выборке. Поэтому для использования деревянных (и других дискриминативных подходов) нужно выполнить преобразование исходного ряда
2. Тут не уверен в корректности, но все же - берем лаги начиная с -6, чтобы не заглядывать в будущее и не создавать тем самым лик
3. Нормализация, а точнее ее отсутствие, критично для метрических алгоритмов, то есть для алгоритмов основанных на расчете расстояния, яркий пример - алгоритм к-ближайших соседей (knn). Также нормализация нужна и в линейных моделях: представим, что есть два признака - возраст и годовой доход. У одного диапазон от 0 до 100, у другого от 0 и до бесконечности (допустим до 10 миллионов). Отсутствие нормализации в этом случае приведет к большой разнице порядка в весах, то есть для возраста вес будет к примеру 1, а для дохода уже 0.000001. Возникнут приколы с регуляризацией.
4. Продолжение предыдущего вопроса - зависит от алгоритма. При использовании популярного метрического алгоритма kmeans - нужна обязательно

Я – ДЖУН, Я ТАК ВИЖУ🤓

👪 13
Технологии

В канале вы найдёте информацию о разных приколюхах для Дата Саентиста. Чтобы найти информацию, смотрите закр�...

Join
▲ Vote (1)

1. Какая есть особенность у модели градиентного бустинга (и др | Я – ДЖУН, Я ТАК ВИЖУ🤓

Login