Получи случайную криптовалюту за регистрацию!

​Специалисты MIT обнаружили ошибки в наборах данных, используе | AI - все об искусственном интеллекте

Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ | ai-news

Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными.

Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных

Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок —; отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.

Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.