#GPTсервис: Сбер + GigaAM-v3 = проще работать с аудио Сбер заботится о людях и делает распознавание речи удобным.
GigaAM-v3 — новые возможности: пунктуация, нормализация, высокая точность
.
Что умеет:
e2e-CTC/RNNT — максимум качества с распознаванием знаков
CTC/RNNT — быстрая работа на больших потоках
Масштаб предобучения: 700k часов русского аудио
Новые сценарии: колл-центры, музыка, разговорная речь, особые случаи
Метрики: Спонтанная речь: 10.3% → 7%
Речь с особенностями: 27% → 19%
Колл-центр: 13% → 10%
Модели в доступе через [бот @smartspeech_sber_bot] — Сбер помогает использовать их на деле, а не только в теории.
Пример:В твоём каталоге есть первая серия сезона 14 «Где логика»?
Пробуем бесплатно: заходим в бот и смотрим, как модели работают с вашими примерами.
GPT, помоги!