Получи случайную криптовалюту за регистрацию!

​​Генерация изображения по текстовому запросу «Сбер» представ | ШЕФ ПЕРЕХОДНИК

​​Генерация изображения по текстовому запросу

«Сбер»
представил нейросеть, которая создаёт изображения по описанию на русском языке и назвал ее ruDALL-E. Нейросеть обучается одновременно на картинках и текстах и может создавать неограниченное число новых изображений по заданному описанию

ruDALL-E состоит из трёх нейросетей, первая принимает текст и генерирует заданное число картинок, вторая выбирает более удачные, третья — увеличивает их в размере без потери качества.

Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение. По данным «Сбера», обучение ruDALL-E стало самым большим нейросетевым вычислительным проектом в России и СНГ.

#интересно