2021-05-18 08:08:30
Стандартный алгоритм построения решения на базе машинного обучения:
1) Обзор литературы, обзор имеющихся решений (GitHub).
2) Набор датасетов.
При обзоре литературы обращать внимание на чём тренировали свою модель авторы. Также нужно искать датасеты самостоятельно.
3) Построение baseline-модели (тривиальный предиктор).
baseline-модель - это самое простое из возможных решений. Простой моделью может быть расчёт среднего, когда текущее значение равно предыдущему и др. Метрики baseline-модели могут показать на сколько каждая последующая модель отличается от основной.
4) Эксперименты: построение новых фичей, построение новых моделей, подбор гиперпараметров.
Можно попробовать другие подходы из статей + собственные идеи. На этом этапе необходимо для каждой новой модели (решения) делать трекинг. Трекинг заключается в том, что все изменения модели фиксируются, делаются бекапы контрольных точек, сохраняются значения метрик, последовательно описывается процесс изменения модели/используемых данных. Когда ведёте трекинг, не забывайте указывать временные метки.
5) Ablation tests.
Контрольные тесты, анализ устойчивости модели к разным данным, чувствительность модели на входные показатели, удаление компонентов модели, чтобы понимать как ухудшается её качество.
6) Исследование.
Почему помогло то, что пробовали в ходе экспериментов?
P.S.: Пункты 5 и 6 обычно используются для написания статьи. В практической работе их часто не делают.
#machinelearning #АнализДанных #ML #neuralnetworks #bigdata #нейронныесети
Источник ВК
135 views05:08