Google продемонстрировали нейросеть VLOGGER, которая может генерировать видео “говорящего” человека на основе фотографии, изменять мимику и переводить речь с синхронизацией движения губ на другом языке.
Нужно только подгрузить фото и аудиодорожку
https://enriccorona.github.io/vlogger/