Мыcли очередного дата-сайентиста

Адрес канала:

Категории: Образование

Язык: Русский

Количество подписчиков: 331

Описание канала:

О компьютерном зрении, хакатонах, науке и преподавании
@exceptmeplsnow

▲ Vote (1)

Рейтинги и Отзывы

2.67

3 отзыва

Оценить канал everydaycv и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения

2022-12-25 15:15:00

Поздравление с наступающим Новым годом от Boston Dynamics!

39 views12:15

Открыть/Комментировать

2022-12-21 13:48:34 Про распознавание лиц, метрики качества и восстановление изображений (продолжение)

Важно понимать, что никакое утверждение нельзя принимать на веру, пока оно не будет доказано. Да, безусловно, существует зависимость между качеством изображения и точностью распознавания, но нам ведь нужен какой-то количественный параметр для принятия решений. Метрики качества для изображений можно разделить на две больших категории: эталонные(PSNR,SSIM) и безэталонные(BRISQUE, NIQE, PIQE и т.д.). Вторая группа метрик более предпочтительна, так как в реальности у нас не может быть неискаженного эталона, который так необходим первой группе метрик. Нельзя сказать, что эталонные метрики совсем нигде не используются: во многих работах по восстановлению изображений их считают показателем качества восстановления. Любопытно, что в своей магистерской диссертации я показал, что повышение качества по метрикам SSIM и PSNR не влияет на точность работы модуля распознавания лиц. А вот улучшение качества по безэталонным метрикам ведёт к повышению точности распознавания. Но это говорит лишь о том, что существует корреляция между качеством изображения и точностью работы модуля распознавания лиц, как, например, есть корреляция между ростом и весом человека. Но ответа на главный вопрос так и нет: а есть ли метрика качества изображения, которая всегда отражает качество распознавания? На поиски ответа на этот вопрос направлено моё текущее исследование.

65 viewsedited 10:48

Открыть/Комментировать

2022-12-21 13:48:34 Про распознавание лиц, метрики качества и восстановление изображений

Когда-то я работал в компании "КСОР", основным продуктом которой является система мониторинга функционального состояния водителей и машинистов. Помимо того, что система должна уметь определять наступление таких событий, как курение, разговор по мобильному телефону, зевание, засыпание, система должна идентифицировать нарушителя.
Система работает круглосуточно и круглогодично, поэтому у камер видеонаблюдения есть инфракрасная подсветка (ИК), что позволяет различать лицо человека даже в тёмное время суток. Но это создаёт дополнительные ограничения и сложности: ИК подсветка обязывает нас использовать монохромное(одноканальное) изображение, то есть информации у нас ровно в три раза меньше, чем если бы мы использовали трёхканальное изображение(RGB). Информация(фичи) в машинном обучении, как нам известно, один из решающих факторов качества модели.

Давайте поймем, как работает система распознавания лиц. Для простоты будем представлять себе модуль распознавания лиц в качестве "чёрного ящика": на вход приходит изображение, а выход представляет из себя набор вещественных чисел, который "кодирует" лицо.
Этот набор принято называть "вектором признаков" или эмбеддингом. Все дальнейшие манипуляции связаны с тем, как хранить этот вектор признаков, как мэтчить людей и в какой момент времени нужно создавать новый профиль для человека.

Система распознавания лиц у нас есть, мы даже упрощенно понимаем, как она работает и какие перед ней стоят задачи, а в какой момент времени проводить распознавание? Очевидно, что нам бы хотелось максимизировать точность распознавания. Этот тезис подводит нас к ключевой задаче, решение которой не менее интересно, чем распознавание: определение качества изображения. Предположим, что мы умеем решать эту задачу. Мы определили, что изображение низкого качества, но возникает закономерный вопрос - можем ли каким-то образом повысить его качество? Те, кто знакомы с классическим компьютерным зрением, должно иметь представление о фильтрации изображений: классическая теория обладает сильным теоретическим и практическим аппаратом для фильтрации нормального шума, шума "соль и перец", а также для борьбы с периодическими помехами.
Думаю, что каждый из нас хоть раз в жизни получал нечёткие изображения:
1) мы пытались сфотографировать движущийся объект, поэтому на изображении возникает искажение типа "смаз";
2) наша камера не успела сфокусироваться на объекте, тогда возникает расфокусировка.
На изображениях, которые были доступны для анализа, чаще всего встречался первый тип искажений. Причина его возникновения - движение камеры относительно объекта или объекта относительно камеры. Задача компенсации смаза полностью до сих пор не решена: вряд ли можно представить универсальное решение на все случаи жизни, но нам это и потребуется. Как говорит мой научный руководитель, решение задачи состоит не в полном переборе всех доступных вариантов, оно должно быть логичным, обоснованным и целенаправленным. Это позволяет для ряда локальных задач предложить методы и идеи, которые превосходят общепринятые подходы. При восстановлении изображение может возникнуть ситуация, когда картинка начинает деградировать: визуальное качество искаженного изображения лучше, чем восстановленного. Таким образом, даже если мы уже восстановили изображение, нам всё равно нужно понять, а не сделали ли мы хуже, чем было до нас. Это возвращает нас обратно к задаче оценки качества изображения.

52 viewsedited 10:48

Открыть/Комментировать

2022-12-13 14:04:22

Не о хакатонах.
Так как я обучаюсь в аспирантуре, то одна из моих обязанностей - педагогическая практика. Я веду практикум по математическому анализу на языке Python. Конец семестра, последнее задание перед выставлением оценок. По-моему, этот шедевр достоин внимания. Чётких пределов нет, следовательно, чёткой оценки тоже.

118 views11:04

Открыть/Комментировать

2022-12-05 12:52:14 Разбор задачи "Детекция человеческих силуэтов на снимках лесного
массива, полученных с помощью БПЛА" наконец-то доступен на Хабре. В статье разбирается вопрос о том, откуда брать дополнительные данные, как обучать модель, какие готовые open-source решения можно было использовать, а также раздел о том, что можно было сделать лучше или как победить в соревновании.
https://habr.com/ru/post/699076/

152 views09:52

Открыть/Комментировать

2022-12-03 20:34:23

Всем тем, кто увлекается машинным обучением и нейронными сетями, советую поучаствовать в VK Cup 2022. Соревнование состоит из нескольких этапов, так что интересно будет всем. Организаторы обещают, что в каждом этапе будет cвоя тематика. В первом этапе задача связана с NLP: по набору постов нужно определить, какой именно вид спорта обсуждается в выбранном сообществе VK. У меня очень скудные знания по NLP, я единожды решал задачу, в которой нужно было произвести классификацию текста. В следующий раунд проходят топ-256. Посидев несколько часов, я смог попасть в топ-13, пока что это только начало соревнования, так что явно всё изменится, но шанс точно есть у всех.

Ссылка на соревнование: https://cups.online/ru/contests/VKCup2022

216 viewsedited 17:34

Открыть/Комментировать

2022-11-25 17:21:23

Интересно ли вам посты про распознавание лиц или оптимизацию нейронных сетей для одноплатных компьютеров?

Anonymous Poll

19%

Распознавание лиц

Оптимизация нейронных сетей

81%

Интересно все

Неинтересно ничего

21 voters147 views14:21

Открыть/Комментировать

2022-11-25 17:21:21 Пока я пытаюсь дописать статью с разбором задачи, хочу провести небольшой опрос. В данный момент я обучаюсь в аспирантуре, а моя кандидатская работа будет связана с распознаванием лиц, поэтому мне есть, что рассказать насчёт этого. Основное моё направление в работе - это запуск нейронных сетей на маломощных вычислительных устройствах. Например, уже ставшей классикой Raspberry Pi может классифицировать объекты со скоростью 30 FPS, примерно аналогичную скорость можно получить и для детектора объектов. Очень много статей и рассказов о том, что делать, если у вас есть CUDA, но нет почти никакой информации о том, что делать, если у вас только CPU.

131 viewsedited 14:21

Открыть/Комментировать

2022-11-12 13:51:51

Новому разбору быть ! В этот раз у меня было не так много времени, чтобы поучаствовать в соревновании, поэтому я делал всё в последние несколько часов до дедлайна. Итог все же неожиданный. В 8 утра я был на 16 месте на публичной части лидерборда, а на приватной части поднялся вверх на 7 пунктов. Ждите новую статью с кодом.

154 views10:51

Открыть/Комментировать

2022-10-28 15:52:18

В задаче "Детекция человеческих силуэтов на снимках лесного массива, полученных с помощью БПЛА" происходит такой цирк..
Организаторы решили, что им нужно придумать свою "метрику" качества работы решений. Казалось бы, а что тут может пойти не так ? Один из участников решил сделать два сабмита: они почти одинаковые, только переставлены местами объекты. Участник получает два разных значения скора. Конечно же, тут выясняется, что участники(!) должны перед отправкой отсортировать координаты сначала по x, потом по y. Почему я негодую ? Уже давно придумали метрику, которая инварианта к такого рода перестановкам, - MAP. Изобрели велосипед, но забыли про колёса

179 viewsedited 12:52

Открыть/Комментировать