Получи случайную криптовалюту за регистрацию!

​Casual Conversations: датасет от FAIR, нацеленный на увеличен | AI - все об искусственном интеллекте

Casual Conversations: датасет от FAIR, нацеленный на увеличение инклюзивности нейронных сетей | neurohive

FAIR представил датасет Casual Conversations, состоящий из 45 186 видео с людьми разного возраста, пола и цвета кожи. Датасет позволит разработчикам оценивать однородность распознавания данных параметров моделями компьютерного зрения в различных подгруппах людей.

Casual Conversations – первый общедоступный датасет с участниками, которые сами указали свой возраст и пол

В предыдущих датасетах эти данные указывались третьими лицами или предсказывались с использованием моделей машинного обучения. Датасет решает проблему предвзятого отношения к людям на основе ошибочных предсказаний их возраста и пола. Также для каждого видео проставлены условия освещенности и цвет кожи по шкале Фитцпатрика (см. рисунок), что позволит проанализировать, как системы искусственного интеллекта определяют цвет кожи в различных условиях освещенности. На сегодняшний день большинство моделей менее точно распознают определенные подгруппы людей из-за того, что обучающие датасеты недостаточно полно учитывают возможные оттенки кожи.

Это может привести к потенциально вредным последствиям для отдельных лиц и групп. В частности, некоторые алгоритмы принятия решений в здравоохранении из-за ошибок распознавания несправедливо лишают людей возможности получить необходимое лечение.