2022-12-23 16:33:30
Цель машинного обучения — предсказать результат по входным данным. Чем разнообразнее данные, тем точнее результат.
Если мы хотим обучить машину, нам нужны:
Данные. Хотим предсказывать курс валют — нужна история рынка, определять автоматически спам — нужны примеры спам-писем, узнать интересы пользователя — нужны его данные о его реакциях.
Без достаточного количества и качества данных можно быстро разочароваться в искусственном интеллекте: машина просто не сможет увидеть закономерности, если примеров будет мало или они не будут охватывать репрезентативный период.
Признаки. Свойства, характеристики, признаки — ими могут быть пробег автомобиля, пол пользователя, цена акций, даже счетчик частоты появления слова в тексте может быть признаком.
Хорошо, когда данные просто лежат в табличках — названия их колонок и есть признаки. А если у нас сто гигабайт картинок с котами? Отбор правильных признаков часто занимает больше времени, чем все остальное обучение.
Алгоритм. Одну задачу можно решить разными методами. От выбора метода зависит точность, скорость работы и размер модели. Но есть нюанс: если данных мало, они неточные или же плохо определены признаки этих данных, даже самый лучший алгоритм не поможет. Поэтому не зацикливайтесь на тестировании разных алгоритмов и на процентах точности, сначала соберите побольше данных.
Подробнее прочитать о том, как начать внедрять в компании ML-технологии, можете в нашей статье.
2.6K viewsedited 13:33