Генерация изображения по текстовому запросу «Сбер» представ | ШЕФ ПЕРЕХОДНИК
Генерация изображения по текстовому запросу
«Сбер» представил нейросеть, которая создаёт изображения по описанию на русском языке и назвал ее ruDALL-E. Нейросеть обучается одновременно на картинках и текстах и может создавать неограниченное число новых изображений по заданному описанию
ruDALL-E состоит из трёх нейросетей, первая принимает текст и генерирует заданное число картинок, вторая выбирает более удачные, третья — увеличивает их в размере без потери качества.
Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение. По данным «Сбера», обучение ruDALL-E стало самым большим нейросетевым вычислительным проектом в России и СНГ.
#интересно