Получи случайную криптовалюту за регистрацию!

Почему GoTranscribe лучше программ распознавания речи Разумее | GoTranscribe — расшифровка аудио в текст, транскрибация

Почему GoTranscribe лучше программ распознавания речи

Разумеется, загрузить аудио в программу очень просто, но если ваша задача — получить связный текст, а не отдельные слова, результат может вас не обрадовать.

Современные алгоритмы компьютерного распознавания речи демонстрируют чудеса при преобразовании в текст записей речи на языках без гибкой морфологии. Алгоритмы на достойном уровне преобразовывают в текст короткие голосовые команды.

Однако все меняется, когда приходят «они»: помехи на записи, реальная манера людей говорить и... окончания великого и могучего.

К сожалению, та самая гибкость форм слов русского языка, которая придает ему красоту и изящество, представляет собой пока непреодолимый барьер при расшифровке живой русской речи.

Например, компьютерный алгоритм не способен различить и корректно записать падежные формы слова «знание»: «знании», «знания», «знаний». В разговоре мы попросту проглатываем окончания слов, справедливо предполагая, что собеседнику и так понятно, что было дальше. Но вот роботы в этот момент от растерянности начинают просто гадать.

На слух невозможно правильно записать «также»«так же», «ввиду» «в виду» и другие омофоны. И чем более шумная обстановка вокруг, чем больше люди перебивают друг друга и чем меньше их речь похожа на язык из учебников по русскому и классической литературы, тем сложнее становится эта задача.

В итоге в транскрипте естественной русской речи приходится исправлять практически каждое слово, не говоря о необходимости расстановки знаков препинания и заглавных букв.

При подсчетах временных затрат получается, что быстрее и проще набрать текст с нуля, чем исправлять ошибки робота.

Мы регулярно тестируем новые алгоритмы распознавания, и пока машинам не удается существенно изменить баланс сил.

К счастью для носителей русского языка, есть и хорошие новости: у GoTranscribe есть команда, которая умеет слушать и любит на нем писать. Так что до наступления сингулярности кропотливую работу по набору текста с аудиозаписей можно поручить нам.