Получи случайную криптовалюту за регистрацию!

ИИ научили синтезировать реалистичную речь с помощью YouTube и | Нейромонах. Новости ИИ

ИИ научили синтезировать реалистичную речь с помощью YouTube и подкастов

В большинстве случаев ИИ, который генерирует речь, обучают на датасетах, где записана речь профессиональных актеров. Из-за этого человеческому уху синтетический голос кажется безэмоциональным и монотонным.

Чтобы исправить ситуацию, исследователи из университета Карнеги-Меллона в США решили тренировать искусственный интеллект на видео с YouTube и подкастах. Прослушав почти 900 часов такого контента, модель научилась реалистично делать паузу, использовать междометия и слова-паразиты. Работу ИИ можно оценить на записи выше.

Людей, которых просили оценить реалистичность голоса, поставили ему 3,89 по пятибалльной шкале. Это выше, чем в среднем получают подобные ИИ-модели (настоящий человеческий голос получил оценку 4,01)

@Нейромонах