SEER: new era of computer vision Разработчики из Facebook AI создали новую нейросеть для задач компьютерного зрения — SEER. Особенностью модели является предварительное обучение на большом наборе неразмеченных изображений. Такой подход подобен предварительному обучению языковых моделей для
NLP-задач — благодаря большему количеству входных данных и миллиардам параметров самих моделей, качество обучения последующих задач значительно улучшается — то же самое должно быть верно и в отношении компьютерного зрения.
У
SEER 1,3 млрд параметров, и она может использоваться для обнаружения и классификации объектов. Предварительно обучившись на миллиарде случайных снимков из Instagram, SEER достигла точности 84% на датасете
ImageNet.
Что все это значит?Работа
SEER демонстрирует, что обучение с самоконтролем может преуспеть в решении задач компьютерного зрения в реальных условиях. Это крупный прорыв, который в конечном итоге открывает путь к более гибким, точным и адаптируемым моделям компьютерного зрения в будущем.