Получи случайную криптовалюту за регистрацию!

​​ Из текста в анимацию: что интересного в нейросети CogVideo | The Tech

​​ Из текста в анимацию: что интересного в нейросети CogVideo

Мы продолжаем делиться и рассказывать о новинках в IT-сфере, и сегодня затронем сервис CogVideo, с помощью которого можно делать анимации. Нейросеть способна создать 4-секундный ролик из 32 кадров на основе вашего текстового описания. Что любопытного в данной программе - расскажем в нашем посте.

Не в новинку

Сервисы, которые способны генерировать изображения на основе текста, появляются будто грибы после дождя. DALL-E 2, Imagen от Google и многие другие приложения создают причудливые, но реалистичные статические изображения. Обученные трансформаторы так и норовят занять рынок стоковых картинок и видео.

Барьеры

CogVideo в каком-то смысле уникальный: преобразование текста в видео содержит многокадровый формат, то есть раскадровку, из которой можно выбрать более подходящие варианты. Технология удивляет своими анимациями, но для запроса нужно текст вводить только на китайском языке. К тому же сами разработчики отмечают, что потенциально огромные вычислительные затраты делают обучение с нуля недоступным, а иногда искусственному интеллекту (ИИ) сложно понять семантику движения.

В итоге

Подобные сервисы действительно завораживают. Возможно, в ближайшем будущем мы увидим небольшие видеоролики, которые созданы полностью ИИ или даже в полноценных фильмах будут использоваться подобные алгоритмы. Взаимодействие человеко-машинного интерфейса позволит цифровым сервисам изменить способы выполнения работы и расширить возможности тех, кто ее выполняет.

Телеграм-канал: @thetechkz