PIXART-Σ: Weak-to-Strong Training of Diffusion Transformer for | эйай ньюз

PIXART-Σ:
Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

Китайцы из Huawei опубликовали новую text2image модель, которая может генерить картинки в 4к! Результаты выглядят очень достойно.

Архитектура основана на DiT (как и у Stable Diffusion 3), но с модифицированным аттеншеном. Кажется, теперь все новые text2img и yext2vid будут на базе DiT, UNet уходит в историю.

Сайт проекта
Демо (только в 1024p)
Кода пока нет

@ai_newz

эйай ньюз

🤷‍♂️ 47.03K
Технологии

Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессио�...

Join
▲ Vote (1)

PIXART-Σ: Weak-to-Strong Training of Diffusion Transformer for | эйай ньюз

Login