«ВКонтакте» открыла свои технологии распознавания речи
Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений
Команда «ВКонтакте» сообщила хорошую новость для сторонних разработчиков. Теперь разработчики смогут бесплатно использовать в своих проектах технологию «ВКонтакте», которая считывает голос и переводит его в текст.
Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на открытии конференции Saint HighLoad++. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько нажатий. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений.
Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдёт для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой.