2021-11-23 09:44:56
После вчерашней конференции HOT Summit, где фейсбук был на коне, и ночного поста Digital Doctor про распознавание внимания, посетила мысль, что машинное обучение — это инструмент, такой же вредный для всего вокруг, включая нашу карту, как и блокчейн. Одна из тех вещей, что жрут технику, окружающую среду и людей, не принося пользы.
Да, я понимаю, что это звучит по-старпёрски. Да, я знаю, что все технологии можно применять для полезных дел. Распознавание домиков и рек отлично работает, да и в статистике у ML отличные инсайты иногда бывают. В крипте тоже есть зёрна здравомыслия.
Проблемы начинаются, когда технологии становятся массовыми, и ими занимается каждая первая компания. Это как с лесозаготовками или рыбной ловлей: пока технологии не были прокачаны, выработка была сбалансирована, и всем было ок. Теперь леса вырубают тысячами квадратных километров, а в восточных морях популяция снизилась на 70-80%, и лучше не станет. То же и с криптой, которая выжгла рынок видеокарт и энергии.
То же и с ML в картографии. Начали как экспериментальные проекты пораспознавали очевидные объекты. А потом пришли мамонты, корпорации, которые сказали: супер, картографы больше не нужны, запускаем в осм 100 миллионов домиков, и ещё миллиард на подходе. Люди слишком долго рисуют дороги, а нашим ML-щикам мы платим 200к в год: всяко они лучше этих новичков из Азии, пусть за них быстренько дороги распознают и загрузят. И вот у нас есть RapiD и куча датасетов, которые постепенно проникают на карту.
Ачотакова, эффективнее же, нет? Алгоритмы приносят выгоду акционерам, формальные показатели карты растут. Есть недочёты на местах, какие-то отдельные сомневающиеся, но с ними разбираемся, иногда берём в штат, чтобы помогали ML-щикам.
И я не вижу, что это закончится. Напротив — фейсбук купил Mapillary, и это неминуемо приведёт к загрузке распознанных атрибутов улиц, как-то ограничений, указателей и полосности. Научатся распознавать вывески — сначала крупных сетей, типа макдака и пятёрочек, а потом и текстов на вывесках и адресных табличках.
Да, будут косяки. Их будет неприятно много, процентов десять минимум от ввода. Но вы ничего не сможете с ними сделать, потому что объёмы данных слишком велики. Один за другим увлечённые картографы будут опускать руки, уставая от исправления автоматических данных. Ведь править карту в наших редакторах на порядок сложнее, чем рисовать новое. И так мы потихоньку сдадим OSM гуманитарной команде, которой больше данных — лучше, и уйдём в свой маленький форк. Потому что мы на весь этот корпоративно-технологический прогресс не подписывались.
890 views06:44