Получи случайную криптовалюту за регистрацию!

​​Дополнительные «глазные» движения — ключ к автономно самоуп | Транспондер

​​Дополнительные «глазные» движения — ключ к автономно самоуправляющемуся автомобилю

Андреа Бенуччи и его коллеги из Центра исследований мозга RIKEN разработали способ создания искусственных нейросетей, которые учатся распознавать объекты быстрее и точнее. Исследование, недавно опубликованное в научном журнале PLOS Computational Biology, фокусируется на всех незаметных движениях глаз, которые мы делаем, и показывает, что они служат жизненно важной цели, позволяя нам стабильно распознавать объекты. Эти результаты могут быть применены, например, к машинному зрению, чтобы облегчить самоуправляемым автомобилям обучение распознаванию важных объектов на дороге.

Несмотря на постоянные движения головы и глаз в течение дня, объекты в мире не размываются и не становятся неузнаваемыми, хотя физическая информация, поступающая на нашу сетчатку, постоянно меняется. Делают возможной эту перцептивную стабильность нейронные копии команд движения. Эти копии рассылаются по мозгу при любом нашем движении, и считается, что они позволяют мозгу учитывать их и сохранять стабильность нашего восприятия.

Бенуччи разработал сверточную нейронную сеть (CNN) для оптимизации классификации объектов в сфере видимости, при движении глаз. В результате при тестировании варианта сети, который имитировал естественную изменчивость при движении глаз, производительность резко упала до уровня случайности. Однако после обучения сетей на смещенных изображениях, с учетом направления и силы движений глаз, они показали резкий рост эффективности.

В частности, добавление движений глаз и их моторных копий в сетевую модель позволило лучше справляться с визуальным шумом. «Это усовершенствование поможет избежать опасных ошибок в машинном зрении», — говорит Бенуччи, — «Благодаря более эффективному и надежному машинному зрению маловероятно, что изменение пикселей заставит, скажем, беспилотные автомобили маркировать знак остановки как фонарный столб, а военные БПЛА опознавать здание больницы как вражескую цель».

Перенести в машинное зрение схемы из реального мира не так сложно, как кажется. Как объясняет Бенуччи, «преимущества имитации движений глаз и их эфферентных копий подразумевают, что «принуждение» датчика машинного зрения к контролируемым типам движений сделало бы машинное зрение более надежным — сродни человеческому зрению».