Мультимодальная нейросеть от Сбер Называется она 'ruDALL-E', | Багофича
Мультимодальнаянейросеть от Сбер
Называется она "ruDALL-E", а её суть заключается в генерации изображения на основе текстового описания на русском языке.
Причем обучается нейросеть одновременно на двух видах данных — картинках и текстах, а генерация происходит в 3 этапа:
1. Подбор заданного числа картинок. 2. Выборка наиболее подходящих вариантов описанию. 3. Увеличение размера изображения с улучшением качества.
Таким образом можно создавать неограниченное число новых изображений по заданным данным. С бесплатной моделью "ruDALL-E XL" можно ознакомиться на GitHub.