Сложности при создании перевода видео с китайского на русск | [404] — программирование
Сложности при создании перевода видео с китайского на русский
Яндекс Браузер научился переводить видео с китайского на русский. В статье на Хабр рассказали, как для нейросети создавался новый датасет, как использовалась библиотека субтитров от GitHub и модель Hugging Face, обученная на мандаринском диалекте языка.
Из статьи вы узнаете, как язык переводился в текст с помощью словаря токенов по алгоритму PBE, как решали проблему с неправильным распознаванием этого текста в ASR, а также то, как модель училась распознавать тоны по обучающим данным.
Перейти к прочтению
#статья #ai