Бигдатый маркетинг

Адрес канала:

Категории: Бизнес и стартапы

Язык: Русский

Количество подписчиков: 2.74K

▲ Vote (1)

Рейтинги и Отзывы

3.50

2 отзыва

Оценить канал big_python и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения 6

2022-06-09 16:14:10

Возможно, модель DALL-E 2 изобрела свой собственный язык! DALL-E 2 — генеративная модель: она рисует изображения по текстовому запросу

Пользователи на днях заметили, что если на запрошенной картинке есть надписи, то к этому изображению модель придумает «перевод». В общем, выяснилось, что Vicootes может переводиться как «овощи», а Wa ch zod rea ознчает «морских существ, которых может съесть кит».

Я, конечно, сомневаюсь в том, что у модели действительно есть свой «язык», но наличие даже парочки таких примеров выглядит любопытно

470 views13:14

Открыть/Комментировать

2022-06-07 19:31:08

Сегодня предлагаю обсудить автоматизированное машинное обучение (Auto ML)

AutoML пытается автоматизировать весь процесс создания и внедрения систем ИИ: начиная с обработки набора данных и заканчивания подбором модели машинного обучения, готовой к использованию. Получается очень эффективно: вручную перебирать все возможные варианты долго и сложно, а автоматическая оптимизация помогает избежать этот нудный процесс.

AutoML умеет подбирать не только оптимальные параметры для модели, но и саму модель! А еще, ученые считают, что модель созданная ИИ будет менее предвзата и склонна к стереотипам, чем человек.

Я считаю, что специалистам не о чем беспокоиться: все-таки, AutoML вряд ли вытеснит с рынка самих специалистов по работе с данными. В конце концов, компьютеры ведь не вытеснили математиков. Зато они помогут находить нужную архитектуру и параметры в разы быстрее

Кстати, область активно очень развивается: свои продукты AutoML создают уже такие компании как Google, Amazon, Oracle!

689 views16:31

Открыть/Комментировать

2022-06-07 17:22:44

Вы знали, что есть два вида исусственного интеллекта: общий (ОИИ) и узкоспециализированный (УИИ)?

Когда говорят, что ИИ научился решать какую-то задачу, то обычно имеют в виду именно узкоспециализированный ИИ. Тут и само название намекает: возможности модели ограничены ее узкой постановкой. Если попросить модель, которая натренерована генерировать изображения, решить задачу классификации, она просто не справится!

Общий ИИ пока не создали, но его концепция уже понятна. Это как раз та модель, которая, как человек, сможет решать многие задачи. Но тут есть загвоздка: человек обычно сразу же запоминает, как вести себя в той или иной ситуации, а вот ИИ учится на многих-многих примерах. Ученые работают над созданием общего ИИ, но пока серьезных прорывов в области нет.

А пока создают общий ИИ, запасаемся попкорном и смотрим постапокалиптическое кино про роботов. Список тут, не благодарите

800 views14:22

Открыть/Комментировать

2022-06-06 16:39:27

Модель DALL-E 2 дорисовала известные полотна

Помимо генерации изображений по текстовому запросу, нейросеть еще умеет «дорисовывать» готовые картины.

Получилось уж очень красиво, теперь жду новостей, как это будут применять в реальности

791 views13:39

Открыть/Комментировать

2022-06-06 12:38:03

Баттл нашего времени — нейросеть и российский писатель написали совместную книгу, а читателю предлагают понять, какая глава написана нейронкой, а какая — писателем.

Сборник рассказов называется «Пытаясь проснуться», в нем 24 рассказа. Автор части глав — российский художник и писатель Павел Пепперштейн, а автор остальных рассказов — модель ruGPT-3.

Нейронка училась у лучших: ее обучали на рассказах великих русских писателей и Павла Пепперштейна. По словам писателя, стили у обоих «авторов» отличаются, но, работая над текстом, Павел пытался имитировать стиль алгоритма.

Для всех желающих попытаться угадать, где чье авторство, книжку можно найти здесь.

748 views09:38

Открыть/Комментировать

2022-06-05 19:23:17

Теперь ждём, когда ИИ захватит мир

331 views16:23

Открыть/Комментировать

2022-06-04 20:48:23

Каждый день генерируется 2,5 квинтиллиона байт данных (это очень много), а многие компании даже не знают, как вычленить из этих данных инсайты! Ситуацию, когда компании не успевают обработать данные, тогда как новые продолжают поступать, называют усталостью от данных (data fatigue).

Например, это часто случается в компаниях, которые не заморачиваются с качеством сбора данных. Данные собираются беспорядочно и не стандартизируются. Например, по оценкам Forbes, только 46% специалистов используют инструменты для очистки своих данных, прежде чем они попадут в их базу!

У проблемы усталости от данных пока нет решения, но один из рабочих советов — хотя бы тщательно фильтровать и очищать данные, прежде чем пытаться с ними работать.

416 views17:48

Открыть/Комментировать

2022-06-03 16:03:05

Изобретать велосипеды никто не любит, в том числе и специалисты по машинному обучению. Чтобы не обучать модели много раз на похожих данных, исследователи используют так называемое трансферное обучение (transfer learning).

Идея простая: есть несколько больших открытых наборов данных, на которых ученые обучают и тестируют алгоритмы. Эти датасеты обычно очень разношерстные: в известном Imagenet 1000 классов, куда одновременно входят фотографии мартышек, линеек и чашек с кофе. Если обучить алгоритм на таком наборе данных, то он, скорее всего, неплохо справится и с задачей попроще (например, если надо отличить фото кошки от фото собаки).

Обычно делают так: берут предобученную модель, немного ее поднастраивают и дообучают на нужном наборе данных (этот процесс называется fine-tune). Таких предобученных моделей в свободном доступе полно, в том числе и для разных задач. Так, дообучение занимает сильно меньше времени, а точность модели обычно получается выше, чем при обучении с нуля и «влоб»

301 views13:03

Открыть/Комментировать

2022-06-03 13:33:03 Сегодня пятница, и по традиции предлагаю вспомнить, что интересного произошло на этой неделе:

Ученые из Центра компетенций НТИ «Искусственный интеллект» на базе МФТИ создали систему на основе ИИ для оптимизации движения железнодорожного транспорта. В ее основе нейросеть, которая учитывает в режиме реального времени местоположение каждого поезда и около 30 дополнительных параметров.

В России собираются ввести уголовную ответственность за продажу украденных персональных данных. В разработке соответствующего законопроекта активно участвует Роскомнадзор (РКН). Минцифры также предлагает наказывать и компании, из которых произошли утечки — штрафы могут достигать 1% от оборота компании.

В автомобилях Honda появится ИИ для оценки когнитивных способностей водителя. Система будет анализировать мозговую деятельность, движения глаз и другие параметры водителя с помощью различных датчиков и технологий МРТ. Например, если ИИ заметит, что в поле зрения водителя не попал пешеход, водителя предупредят.

В России появится специальная Комиссия по этике в сфере ИИ. В Национальную комиссию по этике в сфере ИИ были избраны руководители ИТ-компаний, профессоры институтов и научно-исследовательских организаций.

В Роскомнадзоре признали факт ограничений VPN-сервисов. Председатель комитета Госдумы по информационной политике Александр Хинштейн сообщил, что в России уже заблокировано около 20 популярных сервисов VPN, и РКН намерен продолжить эту работу.

Облачная среда Google Colab для работы с кодом запретит использовать платформу для генерации дипфейков. Google Colab предоставляет доступ к графическим процессорам (GPU), необходимых для обучения нейронных сетей. Многие открытые алгоритмы для генерации дипфейков были как раз выложены в Google Colab.

73% HR менеджеров используют ИИ в своей работе. Большинство опрошенных также заявили, что планируют увеличить использование ИИ в течение 12-18 месяцев. Из проблем HR работники отмечают сложности с интеграцией в существующие системы, убеждении в том, что ИИ не может принимать лучшие решения, чем люди и отсутствие конфиденциальности данных.

336 views10:33

Открыть/Комментировать

2022-06-02 12:15:36

В Московской области внедряют систему распознавания силуэтов

Московская область и два других региона (какие именно, не сообщается) вводят в эксплуатацию платформу видеоаналитики NtechLab, которая умеет распознавать силуэты. Цель проекта — отследить загруженность и обеспечить безопасность объектов. К данным будут иметь доступ оперативные службы и адвокаты.

Сейчас система используется уже в 200 локациях: парках, медицинских учреждениях, на автобусных остановках. Так система поймёт, какие объекты перегружены и, например, сможет предложить оптимизировать транспортные маршруты. Из возможных проблем — дефицит вычислительных ресурсов.

277 views09:15

Открыть/Комментировать