Google AI представила масштабируемый генератор датасетов Kub | NeuroHive - Нейронные сети, Machine Learning, AI, Data science
Google AI представила масштабируемый генератор датасетов Kubric. Kubric – open-source фреймворк, использующий PyBullet и Blender для создания высококачественных изображений.
Синтетические данные имеют множество преимуществ над реальными, включая более низкую стоимость сбора данных, большее количество меток, контроль свойств датасета и избежание рисков, связанных с лицензированием и конфиденциальностью.
В Kubric PyBullet обучает модель физическому моделированию взаимодействия с другими объектами, а Blender используется для рендеринга изображений. Инструмент был создан для снижения затрат и ресурсов, связанных с получением реальных данных.
Разработчики продемонстрировали эффективность Kubric, используя серию из 13 отдельных датасетов, которые были сгенерированы для задач распознавания объектов в видео нейросетью без учителя. Особенностью Kubric является возможность быстро генерировать крупномасштабные датасеты.
Github: https://github.com/google-research/kubric
Источник: https://arxiv.org/abs/2203.03570
#Datasets