2022-06-20 12:49:30
Предсказываем возраст по голосу говорящегоБольшинство людей знакомы с тем, как запустить проект по машиннному обучению на изображениях, тексте или табличных данных. Но не у многих есть опыт анализа аудиоданных. В этой статье мы узнаем, как мы можем сделать анализ аудио. Как подготовить, изучить и проанализировать аудиоданные с помощью машинного обучения. Вкратце: как и для всех других модальностей (например, текста или изображений), хитрость заключается в том, чтобы преобразовать данные в формат, интерпретируемый машиной.
Интересная вещь с аудиоданными заключается в том, что вы можете рассматривать их как множество различных модальностей:
- Вы можете извлекать фичи и анализировать данные, такие как табличные данные.
- Вы можете строить частотные графики и анализировать данные, такие как данные изображения.
- Вы можете использовать модели и анализировать данные, с помощью временных рядов.
- Вы можете использовать модели преобразования речи в текст и анализировать данные, как текстовые данные.
Сначала давайте подробнее рассмотрим, как на самом деле выглядят аудиоданные.
Читать дальше
@machinelearning_ru
2.2K views09:49