DLStories | Нейронные сети и ИИ

Адрес канала:

Категории: Технологии

Язык: Русский

Количество подписчиков: 13.15K

Описание канала:

Новинки искусственного интеллекта и нейронных сетей. Разборы статей.
Ну а вообще, посчу, что захочу :)
Сотрудничество/предложения: @atmyre
Поддержать: https://t.me/dl_stories/521

▲ Vote (1)

Рейтинги и Отзывы

2.50

2 отзыва

Оценить канал dl_stories и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения 4

2022-05-17 15:28:34

Gato от DeepMind — модель, которая умеет решать сразу кучу задач: language modeling, image captioning, играть в игры, передвигать предметы робо-рукой и т.д.

Идея Gato очень проста. Смотрите, у нас есть GPT-3 — авторегрессионная модель, которая умеет предсказывать следующий токен по входной последовательности. Что если другие задачи — image captioning, RL и т.п.— тоже представить в виде "предскажи следующий токен по предыдущим"?

Например, преобразуем картинки в последовательность токенов, будем подавать их на вход модели и ждать ответ — caption картинки. Иля для RL: представим информацию о состоянии среды и предыдущих действиях агента в виде последовательности. Подадим модели на вход и будем ждать ответ — следующее действие для агента.

Получается, Gato — это GPT-3 для решения сразу 604( ) задач, которые представляются в таком виде.

Как информация для разных задач кодируется в последовательности токенов и какие задачи решает Gato, читайте в блоге DeepMind и в статье на arxiv.

2.5K views12:28

Открыть/Комментировать

2022-05-16 19:41:16

До чего техника дошла: на СТС собираются снять сериал (реальный!) по сценарию нейросети

Сериал будет называться "Сидоровы". Авторы модели для генерации сценария — студенты специализации Data Scientist PRO Скиллбокса. Чтобы получить новый сценарий, они загрузили в нейронку (интересно, в какую) сценарии других отечественных сериалов.

Следить за новостями проекта можно в группе Вконтакте. Кстати, для набора актеров в сериал будет кастинг в VK Клипах =)

Подробнее о сериале и сюжете тут

2.8K views16:41

Открыть/Комментировать

2022-05-15 14:31:42

Не придумала, что написать вам в выходные, поэтому вот вам недавний мем

Даже грустно становится (

2.6K views11:31

Открыть/Комментировать

2022-05-12 13:56:33

Тут Landing AI открыл набор на бета-тестирование своей платформы для MLOps Landing Lens.

Landing AI помогает компаниям быстрее проделывать путь от концепции AI-продукта до его полной разработки и деплоя. Основатель компании — Эндрю Ын, один из самых видных людей в области AI и AI Education.

Landing Lens — главный продукт компании. Это data-centric MLOps платформа. Она позволяет проделать весь путь от загрузки и обработки данных до обучения AI-модели и ее деплоя. Все это — не выходя из красиво оформленного приложения с приятным интерфейсом. У Landing Lens много возможностей работы с данными и мониторинга работы финального решения — не просто загрузить, обучить нейронку и получить модельку в .tar.gz на выходе, а полноценный MLOps.

Подробнее о data-centric AI и о том, какие проблемы помогает решать платформа, читайте на сайте. А видео с примером работы платформы смотрите тут.

Зарегистироваться в бета-тестеры и получить бесплатный доcтуп к платформе можно тут (до 14 мая)

1.9K views10:56

Открыть/Комментировать

2022-05-11 15:43:53

Snap выпустил плачущий фильтр. И это пушка!

Реализм зашкаливает. Если сильно не вглядываться, то и не скажешь, что человек на самом деле совсем не плачет. И выражение лица реалистичное, и маска не прыгает, круто!

А все благодаря чему? Благодаря генеративными сетям (ака ганам).

1.8K views12:43

Открыть/Комментировать

2022-05-10 19:38:15

Предлагаем полезнейший набор материалов машинного обучения: @ai_machinelearning_big_data

В канале вы найдете:
Статьи ,
Книги
Код
Ссылки

и много другой полезной информации.

Курсы и тренинги в прошлом. Гораздо быстрее улучшить навыки программирования, если все знания уже аккуратно разложили по полочкам. Рекомендуем каталог лучших ресурсов по машинному обучению: @itchannels_telegram

1 канал вместо тысячи учебников и курсов

@ai_machinelearning_big_data
#промо

2.6K views16:38

Открыть/Комментировать

2022-05-09 12:26:45 MoLeR — новая нейронка от Microsoft Research для drug design

Drug design — задача поиска новых химических соединений, которые могут быть использованы для создания новых лекарств. Задача сложная, биологи тратят годы и огромное количество денег на поиск одной такой молекулы. MoLeR — новая модель, которая должна помочь биологам в их работе.

Для разработки MoLeR исследователи из Microsoft сотрудничали с учеными из Novartis — компании, которая занимается поиском новых лекарств. И идея работы MoLeR основана на том, каким способом ученые в реальности пытаются искать новые соединения.

Вот как ищут новые молекулы в лобораториях:
Часто это делает так: сначала медики находят "hit" молекулы — такие, которые обладают хотя бы какими-то свойствами, полезными для создания лекарства против болезни. Как правило, такие молекулы также обладают и рядом плохих свойств, и сразу взять и сделать из них лекарство нельзя. Поэтому медики берут такую hit молекулу и начинают ее testing. Они пытаются вносить в ее структуру небольшие изменения, стараясь найти такие, которые привели бы к увеличению количества положительных свойств молекулы и уменьшению количества отрицательных. Такой процесс может длиться годы и очень сильно зависит от удачи, интуиции и экспертности.

Модель MoLeR основана на этой же идее: на постепенном улучшении базовой структуры известной молекулы, чтобы получить молекулу с желаемыми свойствами.

Вот как устроена модель:
MoLeR — это VAE. Его энкодер и декодер — графовые нейросети (и молекулы, как обычно это делается в таких моделях, представляются в виде графов). Энкодер сжимает входную молекулу в латентное представление, а декодер учится получать молекулу из латентного представления обратно. Обученный декодер, собственно, и будет использоваться для генерации новых молекул. При обучении автоэнкодер учится кодировать в латентном представлении свойства молекулы. Это достигается добавлением еще одной нейросети в тренировочный процесс: она принимает на вход латентный вектор и учится предсказывать по нему свойства молекулы.

Самое интересное — это устройство декодера MoLeR. Чтобы разобраться в его идее, давайте заметим вот что:

Молекулы — это не просто случайные наборы атомов, связанных случайными связями. В молекулах есть структура, и каждая молекула состоит из нескольких связанных между собой структурных единиц. Это примерно как предложения в языке: предложения — это не случайные наборы букв, а наборы более сложных единиц — слов. При этом слова в предложении связываются тоже не случайно, а согласно правилам, структуре.

Так вот, декодер MoLeR — это нейросеть, которая принимает на вход часть молекулы и учится дополнять эту часть новой структурной единицей. Такой, чтобы через несколько этапов генерации получилась молекула с желаемыми свойствами.
Получается, полную молекулу из латентного представления декодер MoLeR генерирует последовательно: сначала генерирует одну структурную единицу, затем, на следующем шаге, дополняет ее второй структурной единицей и так далее. Это похоже на то, как нейросети для машинного перевода генерируют перевод — шаг за шагом, слово за словом.

Почему это круто: такое устройство декодера MoLeR позволяет не только генерировать молекулу с нуля из латентного вектора. Оно еще позволяет подавать декодеру на вход любую часть молекулы и получать на выходе модели дополненную версию. Это значит, что ученые могут взять hit молекулу, выделить из нее ее базовую структуру и подать на вход модели. И на выходе MoLeR получится молекула, имеющая ту же базовую составляющую, что и hit молекула, но с нужными свойствами.

Это свойство модели MoLeR отличает эту нейросеть от тех, что были предложены для решения задачи drug design ранее. Надеемся, это поможет ученым в их работе =)

Подробнее:
Блог Microsoft Research
Статья о Moler

4.2K views09:26

Открыть/Комментировать

2022-05-08 13:51:44

Наглядное сравнение работы DALL-E и DALL-E 2: знаменитые авокадо-кресла =)

Когда первая DALL-E только вышла в начале прошлого года, во всех новостях иллюстрацией работы модели выступали именно сгенерированные авокадо-кресла. Этот пример показывал, как DALL-E научилась "совмещать несовмещаемое" — то, что раньше модели делать не умели (точнее, умели, но очень плохо)

Теперь можно наглядно сравнить качества генерации картинок обеими моделями на примере авокадо-кресел =) По-моему, результаты DALL-E-2 просто огонь! Сама бы такое прикупила.

А какое кресло из сгенеренных — ваш выбор?

Картинки кресел от DALL-E 2 взяла тут

2.9K views10:51

Открыть/Комментировать

2022-05-05 16:47:26 Веселая новость: Copilot слил коды от реальных криптокошельков пользователей

Copilot — это GPT-3-like модель для написания кода. По начальному фрагменту кода или даже комментария она способна код дополнить. Ею уже пользуются многие программисты в качестве помощника в работе. О Copilot я писала в посте выше.

Что произошло: один разработчик (назовем его Джон) использовал Copilot для написания кода, когда вдруг заметил, что в ответ на его запрос система предложила что-то, похожее на private ключ от криптокошелька. Джон решил проверить, реальный ли это ключ. Он вычислил public ключ, соответствующий найденному private ключу, и обнаружил, что криптокошелек с такими ключами реально существует и работает: у Джона получилось отправить на него деньги и получить их обратно.

Еще несколько других разработчиков с помощью Copilot смогли получить доступы к нескольким криптокошелькам, в которых даже была крипта.

Конечно, то, что Copilot выдал private ключи, означает, что эти ключи и так лежали в открытом доступе на гитхабе, и никакого взлома тут нет. Но ситуация все равно неприятная. Из-за угрозы подобных ситуаций OpenAI еще в прошлом году заявила, что встроит в Copilot фильтр, который не будет пропускать персональную информацию вроде номеров телефонов или домашних адресов. Кажется, туда пора включить и ключи от кошельков)

Ну и пусть это служит напоминанием всегда шифровать свои данные в интернете =)

Источник: The Register

1.5K views13:47

Открыть/Комментировать

2022-05-04 12:27:06 Google Research выложили открытый GitHub-репо с кодом всех своих vision моделей

В репо будет публиковаться код различный моделей компьютерного зрения от гугл — ViT, LiT, MLP-Mixer и прочих. Код оптимизирован так, что обучать модели можно будет на любом железе — CPU, GPU, TPU с разными конфигурациями.

Наполнение еще в процессе, за планами релизов можно следить тут.

К коду прилагается отличный Readme с подробными описаниями модулей и инструкциями к подготовке данных, обучению и тестам моделей.
Выглядит как очень handy и полезная штука

3.8K views09:27

Открыть/Комментировать