Мультимодальная нейросеть от Сбер Называется она 'ruDALL-E', | Багофича

Мультимодальная нейросеть от Сбер

Называется она "ruDALL-E", а её суть заключается в генерации изображения на основе текстового описания на русском языке.

Причем обучается нейросеть одновременно на двух видах данных — картинках и текстах, а генерация происходит в 3 этапа:

1. Подбор заданного числа картинок.
2. Выборка наиболее подходящих вариантов описанию.
3. Увеличение размера изображения с улучшением качества.

Таким образом можно создавать неограниченное число новых изображений по заданным данным. С бесплатной моделью "ruDALL-E XL" можно ознакомиться на GitHub.

#новость #sber

Багофича

🤷‍♂️ 3.56K
Технологии

Оригинальный первоисточник ИТ-лайфхаков и секретов кибербезопасности. Администратор: @andrey_admin...

Join
▲ Vote (1)

​Мультимодальная нейросеть от Сбер Называется она 'ruDALL-E', | Багофича

Login

Мультимодальная нейросеть от Сбер Называется она 'ruDALL-E', | Багофича