2024-04-28 20:01:56
«Яндекс» представил обновленную нейросеть YandexART 1.3Диффузионная нейросеть «Яндекса» перешла на новую технологию для генерации изображений — латентную диффузию. Компания представила YandexART 1.3., которая лучше понимает текстовые запросы и создает более точные и реалистичные изображения. Об этом рассказали в пресс-службе компании.
Компания увеличила датасет, на котором обучалась модель, более чем в два раза. А технология латентной диффузии требует меньше вычислительных мощностей и при этом позволяет генерировать более совершенную графику, пояснили в «Яндексе».
Как устроена технология латентной диффузии?
Технология латентной диффузии создает промежуточное представление изображения в формате латентного кода. Это компактное описание с основными данными об изображении в сжатом формате. После этого нейросеть в один шаг разворачивает код в полноценное изображение высокого разрешения. Как отмечают в компании, данный метод эффективнее многоэтапного уточнения картинки в каскадной диффузии.
Также «Яндекс» увеличил датасет, на котором обучалась нейросеть, в два с половиной раза. В него добавили синтетические тесты. Сам набор данных был увеличен до более чем 850 миллионов пар картинок с текстом.
Для того чтобы YandexART учитывала больше деталей из промта, в новой модели используются не один, а два текстовых энкодера, с помощью которых модель переводит текстовый запрос.
Также теперь с помощью YandexART можно создавать картинки в разных форматах: 16:9, 4:3 или 3:4. Обновление уже действует в «Шедевруме», вскоре оно появится и в других сервисах компании.
Впервые диффузионную нейросеть YandexART компания представила в 2023 году. В «Яндексе» отмечали, что сервис «понимает российский культурный код» и знает важные символы, персонажей и личностей из российской истории.
118.6K views17:01