Компания Nvidia анонсировала новую нейронную сеть для создания видео из текстов. • Данная модель позволяет создавать видео формата 1280x2048 пикселей и длительностью до 4 секунд с частотой кадров в 24 кадра в секунду.
• Компания использовала наработки Stable Diffusion для создания text2video и далее доработала алгоритм, чтобы добиться качественного видео.
• Общее количество параметров модели составляет 4,1 млрд, что является скромным показателем по сравнению с другими конкурирующими решениями.
• В настоящее время продукт находится на стадии исследовательской работы, но уже привлекает внимание ключевых специалистов в области искусственного интеллекта и видеопроизводства.