2022-06-09 15:10:00
Кто и как помогает компаниям обрести голос
SberDevices запустил сервис SmartSpeech YourVoice, с помощью которого компании могут выбрать один голос и использовать его во всех коммуникациях с клиентом. Сервис позволяет быстро озвучивать нестандартный текст для мобильных приложений, телефонных разговоров и сайтов, учитывая паузы и интонации. Синтезирование голосов становится отдельным направлением бизнеса — вот как оно работает:
Как это делает Сбер
Компания-клиент может выбрать 1 из 7 общедоступных голосов в SmartSpeech YourVoice или выкупить голос из пополняемой картотеки. После этого голос из картотеки будет недоступен другим заказчикам. Компания может записать собственный голос, например своего СЕО или известного актера. При этом человек должен сделать четырехчасовую аудиозапись — столько времени необходимо для обучения системы. Затем с помощью SmartSpeech YourVoice компания может озвучивать «своим» голосом любой текст с разной интонацией. Запись также производится на английском, а поверх голоса можно наложить фоновый звук, например пение птиц или шум моря.
Какие еще компании синтезируют голоса
В 2021 году Yandex·Cloud разработал технологию Yandex SpeechKit, позволяющую компаниям создавать голосовых помощников, похожих на Алису. Диктор записывает заготовленные фразы, а ML-модель синтезирует речь. Для обучения модели также необходима четырехчасовая аудиозапись.
В конце года отечественный разработчик Just AI запустил сервис Aimyvoice для покупки и создания синтезированных голосов. Пользователи платформы могут записать собственный голос даже в домашних условиях и заработать на его использовании. В каталоге Aimyvoice есть голоса Татьяны Литвиновой, Кроша, Деда Мороза и Ленина
Российская компания VS Robotics тоже предлагает технологии синтеза речи и разработки уникальных голосовых моделей. Сейчас клиентам доступны 7 мужских и женских голосов на выбор.
Google запустил синтезатор речи Cloud Text-to-Speech в 2018. В этом году компания предложила брендам брать пользовательские голоса для своих коммуникаций. Записать голос можно на 7 языках. Также создавать собственные голоса можно с помощью технологий Amazon Polly Brand Voice и Custom Neural Voice от Microsoft, клиентами которого являются AT&T, Duolingo и Swisscom.
Зачем это нужно
Уникальный голос формирует у потребителей устойчивые ассоциации с брендом, тем самым повышая комфорт коммуникации и лояльность. А использование технологий синтеза позволяет бизнесу оптимизировать финансы и сэкономить время на озвучивании контента. С ростом объема коммуникаций синтезировать голоса становится более выгодно, чем записывать вживую.
Для обычной озвучки диктор может быть занят, тогда как при использовании модели нужна только одна запись — дальше она обучается самостоятельно. Уникальный голос бренда может предотвращать мошенничество — если клиент знаком с единым для всех коммуникаций голосом компании, то при разговоре со злоумышленником клиент может понять, что звонят не из этой компании.
sber.me/?p=DxNnh
923 viewsedited 12:10