2021-06-23 15:36:36
В пятницу на прошлой неделе прошло мероприятие X5 Future Night. Мне очень понравилось – как с точки зрения общения и нетворкинга (давно не было такого ощущения – соскучилась по живому общению!), так и с точки зрения контента и организации!
Не было ни одного слайда (были сессии с живым обсуждением экспертов – а это сложный формат где многое зависит от модератора), но я много записала себе и только сейчас разобрала записи и хочу поделиться с вами тем, что отметила.
Сессия про большие данные – длилась два часа, принимали участие X5, Lamoda, Яндекс, Северсталь, Альфа Банк, Eora: Одни из ключевых задач сегодня:
- инфраструктура, хранение и очистка данных требуют немалых ресурсов и остро встает вопрос монетизации – нужно четко понимаю какие стримы и в каком качестве будут монетизироваться чтобы масштабировать эти возможности.
- Очистка данных от шума, управление всем циклом работ и развитие сопутствующих экспертиз – data governance, data stewardship
- Склейка данных – формирование экосистем и партнерств невозможно без решения этого вопроса. Биржи данных как возможное решение, но стоит вопрос их юридического статуса и выработки рыночных правил игры.
- Много говорили про человеческие ресурсы и острый вопрос понимания сути работы с данными и управления ожиданиями. Бизнес и дата подразделения пока говорят на разных языках и тут важно двигаться маленькими шагами и фиксировать маленькие победы – как в инновациях начинаем с MVP и все тестируем, а не пытаемся сразу сделать Теслу (сначала самокат!)
Работа с данными у крупных бизнесов (на примере Альфа Банка) строится на трех уровнях:
- улучшение качества базовых моделей, которые «питают» основной бизнес – для банков например это скорринг
- проектное использование внешних данных для проверки гипотез и поиска точек роста по новым или существующим продуктам. Например, банки могут понять глубже своих клиентов через ритейл или телеком
- данные под конкретный бриф / задачу – например найти в CRM лидеров мнений для вовлечения в маркетинговую активацию.
Большая часть экспертов на сессии сошлись во мнении, что сейчас основной приоритет для них – это выжать максимум из своих собственных данных и на них же отработать все процессы связи с бизнесом и наработать внутренние кейсы по оптимизации и повышению эффективности. Любые проекты по объединению данных в некую инфраструктуру идут долго и тяжело юридически и процедурно, и поэтому ресурсное планирование в данном случае сопряжено с рисками – инвестиции с непонятным сроком и объемом окупаемости.
Обсуждали типы данных – сейчас, говоря про данные, чаще всего мы подразумевают транзакционные или поведенческие данные (визиты, регистрации). Помимо этого активно развивается компьютерное зрение, которое открывает возможности обработки множества визуальных данных – от потока картинок в Инстаграм до видео наблюдения – например за растениями (динамика роста и идентификация болезней) и использования в агро секторе. Ламода например разработали модель прогнозирования порчи при примерке одежды, что позволяет бизнесу оптимизировать расходы. И тут опять встает вопросы ресурсов и способности поставить дата-подразделению правильную задачу. Бизнес не всегда понимает возможности и аспекты использования данных, а data science чаще всего не знает глубинных задач и барьеров бизнеса. В общем нужны мосты и переводчики с русского на питон )) Я кстати второй день изучаю питон (решила давно и подарила себе на ДР обучение) – первое время ушло на то, чтобы установить PyCharm на корпоративный мак, который как вы понимаете очень безопасный и защищен от меня со всех сторон )) Но я не сдаюсь!
289 views12:36