2021-01-12 13:38:56
В это трудно поверить, но Shazam – сервис по распознаванию мелодий – существует уже 20 лет. На тот момент целевой аудиторией сервиса выступали слушатели радиостанций, которые могли со своей навороченной черно-белой Nokia 8210 позвонить по номеру 2580, подержать телефон у источника звука в течение 30 секунд, после чего получить SMS (ха-ха) с именем исполнителя и названием композиции.
У такой модели было два недостатка.
Первое – ограниченность репертуара до эфира радиостанций. Были и другие конкуренты, которые научились распознавать топ-чарты. А значит, необходимо было расширять область распознаваемых звуков. Хотя представить себе в 2000 году, что звуки будут доноситься из каждой плойки, было сложно. Лишь через 3 года появится iTunes, лишь через 7 лет выйдет iPhone, а через 8 – App Store.
Второе – «музыка тонет в потоке посторонних шумов и голосов». Для решения этой проблемы понадобился кодировщик, который распознавал звуки «музыки» и отделял их от «шума». Согласитесь, с качеством нашей эстрады порой это сложно сделать, куда уж там алгоритму…
Однако вспомнить сегодня о Shazam и истории его развития в многомиллионный сервис, интегрированный в современные музыкальные практики и индустрию, нам позволил Сбер, который анонсировал выход приложения, которое сможет за 60 секунд по кашлю распознать признаки ковида.
По сути, разработчики предлагают пошазамить кашель (а с ним голос и дыхание). Обращаясь к истории Shazam, можно смело сказать, что первую проблему в этом случае удалось обойти за счет изначального тематического сужения приложения. В фокус рассмотрения попадает только «ковидный кашель», а значит, справляться с распознаванием этого объекта сервис должен хорошо, что однако впоследствии может сильно ограничить дальнейшее использование сервиса для выявления других заболеваний.
А вот с другой проблемой, как мне кажется, придется еще изрядно потрудиться. По словам Сбера, модель обеспечивает вероятность правильного распознавания на уровне 80%. Во многом, как и во всех случаях с ИИ, это обусловлено качеством изначальных данных, на которых обучалась модель. Факт диагностики у пациентов ковида не гарантирует безупречное качество собранного аудиоматериала, к тому же могут быть различные дыхательные особенности, свойственные разным половозрастным группам.
Думаю, это понимают и разработчики, оговариваясь, что их сервис не заменяет медицинский тест ПЦР, а является лишь инструментом ежедневного чекинга на случай распознавания первых симптомов. К тому же модели еще учиться и учиться, и чем больше кашля она послушает, тем будет умнее.
Надеюсь, тем не менее, что модель обойдется без нашего кашля. Не болейте!
1.2K viewsKonstantin Glazkov, 10:38