Из текста в анимацию: что интересного в нейросети CogVideo | The Tech
Из текста в анимацию: что интересного в нейросети CogVideo
Мы продолжаем делиться и рассказывать о новинках в IT-сфере, и сегодня затронем сервис CogVideo, с помощью которого можно делать анимации. Нейросеть способна создать 4-секундный ролик из 32 кадров на основе вашего текстового описания. Что любопытного в данной программе - расскажем в нашем посте.
Не в новинку
Сервисы, которые способны генерировать изображения на основе текста, появляются будто грибы после дождя. DALL-E 2, Imagen от Google и многие другие приложения создают причудливые, но реалистичные статические изображения. Обученные трансформаторы так и норовят занять рынок стоковых картинок и видео.
Барьеры
CogVideo в каком-то смысле уникальный: преобразование текста в видео содержит многокадровый формат, то есть раскадровку, из которой можно выбрать более подходящие варианты. Технология удивляет своими анимациями, но для запроса нужно текст вводить только на китайском языке. К тому же сами разработчики отмечают, что потенциально огромные вычислительные затраты делают обучение с нуля недоступным, а иногда искусственному интеллекту (ИИ) сложно понять семантику движения.
В итоге
Подобные сервисы действительно завораживают. Возможно, в ближайшем будущем мы увидим небольшие видеоролики, которые созданы полностью ИИ или даже в полноценных фильмах будут использоваться подобные алгоритмы. Взаимодействие человеко-машинного интерфейса позволит цифровым сервисам изменить способы выполнения работы и расширить возможности тех, кто ее выполняет.
Телеграм-канал: @thetechkz