Получи случайную криптовалюту за регистрацию!

Как программа для распознавания булочек помогает рассматривать | newSpeaks

Как программа для распознавания булочек помогает рассматривать раковые клетки.

Ты заходишь в пекарню, берешь поднос. «Нигде не видно ценников», - думаешь ты. И просто в ступоре от колоссального выбора: круассаны, пироги, торты, сэндвичи. Десятки вариантов. Еще большее удивление тебя ждет, когда ты приходишь на кассу. Под одобряющие жесты кассира ты проносишь свои покупки перед камерой. Они появляются на экране с ценой и названием. Система узнала их по внешнему виду.

Зачем это нужно пекарням?

Новая пекарная компания решила провести маркетинговое исследование. Они пришли к заключению, что чем шире ассортмент, тем больше продажи. А также, что товары без упаковки продаются в три раза лучше, потому что выглядят свежее. Попытка совместить два этих факта привела к кризису: кассиры запоминали все виды товара месяцами, а упаковки со штрихкодом на них не было. Каждый приходилось осматривать – это существенно тормозило процесс. Очереди в магазинах росли. Тогда компания обратилась за помощью к фирме, которая специализировалась на ИИ – Brain.

Как видит компьютер?

Компьютеры научились видеть совсем недавно. Десятки лет компьютерное зрение было недостижимой мечтой. Мы даже не замечаем, как работает наше зрение, в то время как для компьютера окружающий мир – это просто какая-то смесь цветов, света и теней. Он не знает, что деревья колышутся, что в зеркале отражение, а не реальность, а люди скрываются за масками безразличия. О, жестокий мир! Простите, отвлекся. Программисты думали, что без модели, описываюзей как мир работает, и что в нем, компьютер никогда не научится по-настоящему видеть. А перспектива видеть как человек оставалась мечтой.

Все изменилось в 2012 году, когда Алекс Крижевский выпустил программу AlexNet, которая подошла к распознаванию изображений с помощью технологии, которую назвали deep learning – глубокое обучение. «Глубокое», потому что нейроны были расположены на многих слоях. Нейросети «скармливали» изображение, она непременно ошибалась. Но постепенно обучалась, связи между нейронами настраивались, и она становилась все совершеннее. В наши дни почти любая нейросеть работает на этом принципе.

Недостаток системы в том, что она требует большого количества структурированных данных для обучения. Впрочем, компании уже научились ставить обучение на промышленный поток. Вы когда ищете все велосипеды на картинке, вы не доказываете, что вы не робот, а на самом деле бесплатно помогаете будущему Скайнету. Посты в фейсбук и инстаграм с тегами тоже используются. Но все равно проблемы остаются. Изображения в интернете обычно стараются выкладывать идеальные, даже несуществующие (render-porn), и они могут существенно отличаться от реальных.

Когда это всё затевалось AlexNet и глубокого обучения еще не было, и компания Brain пошла по другому пути. Они разработали целую пирамиду алгоритмов. Самый первый алгоритм отвечал за поиск краев, затем передавал дело другому, следующий за поиск типа угощения (круассан или бутерброд или творожное кольцо), следующий за поиск типа типа (круассан с ветчиной, сыром или без ничего) и т.д. Если программа «не уверена», что она все правильно рассмотрела, она просит оператора доказать, что он не робот, т.е. выбрать из небольшого количества вариантов, и дополнительно обучается.

О программе часто рассказывали в японских медиа. Один такой репортаж увидел доктор – исследователь рака. Он связался с компанией-разработчиком и, как оказалось, клетки с патологиями можно похожим образом различать. Разработчики были польщены и удивлены: «Где мы, а где исследования рака», но взялись за проект. Сейчас Brain уже выпустили полноценный сканер, который просматривает десятки тысяч клеток в секунду. Кстати, преимущество программы Brain еще и в том, что можно сказать почему именно программа решила, что та или иная клетка имеет патологию, в отличие от обычного ИИ с глубокого обучением, где непонятно, что заставило программу подумать так или иначе.

Как ИИ используется для того, чтобы за нами следить читайте вот здесь.