DLStories | Нейронные сети и ИИ

Адрес канала:

Категории: Технологии

Язык: Русский

Количество подписчиков: 13.15K

Описание канала:

Новинки искусственного интеллекта и нейронных сетей. Разборы статей.
Ну а вообще, посчу, что захочу :)
Сотрудничество/предложения: @atmyre
Поддержать: https://t.me/dl_stories/521

▲ Vote (1)

Рейтинги и Отзывы

2.50

2 отзыва

Оценить канал dl_stories и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения 5

2022-05-02 14:45:45

Китайцы подвезли дипфейки на стеройдах

Все мы видели дипфейки, где подменяются лица. Эта статья пошла дальше, тут меняют все голову целиком. Чудеса китайской инженерии и 300 лоссов делают свою дело .

По сравнению с обычным "face swap"-ом, новый метод лучше переносит личность с целевой фотографии на видео, сохраняя прическу, брови, и другие атрибуты. Осталось только немного улучшить покадровую стабильность - контуры головы немного дёргабтся. Кода пока нет, но обещают скоро залить.

❱❱ Few-Shot Head Swapping in the Wild

418 views11:45

Открыть/Комментировать

2022-05-01 16:37:20 Начала писать пост об устройстве Flamingo, но он получался слишком большим и не влезал по символам. Поэтому я решила вместо поста написать статейку в телеграф =)

В начало статьи скопировала (почти) предыдущий пост про zero-shot visual-language modelling, чтобы статья была полноценной. Но далее идет новый материал об устройстве модели Flamingo.

Статья вот. Надеюсь, вам понравится =)

1.5K views13:37

Открыть/Комментировать

2022-04-30 17:30:08 DeepMind представляет Flamingo — новую SOTA в задаче zero-shot visual-language modeling.

Что такое zero-shot visual-language modeling:

Language model (языковая модель) — это модель, которая умеет генерировать текст, практически не отличимый от настоящего. Самый яркий пример языковой модели — GPT-3. Подробно про GPT-3 и о том, что умеют языковые модели, я писала в посте выше.

Zero-shot learning — это задача обучения модели решению задачи без предварительного обучения на размеченных данных. Опять же, лучший пример zero-shot модели — GPT-3. Если подать GPT-3 на вход следующий текст:
""
cat -> chat
sister -> sœur
cheese ->
""
, то GPT-3 сгенерирует текст "fromage". То есть, GPT-3 — модель, которая изначально не обучалась на задачу перевода текста, а только на задачу языкового моделирования — смогла без дообучения понять, что входной текст нужно дополнить переводом слова "cheese" с английского на французский. Таким образом, GPT-3 умеет решать разные задачи вроде перевода текста с одного языка на другой без специального обучения под эти задачи, и является zero-shot language model.
Более подробно о zero-shot и больше примеров работы GPT-3 в zero-shot режиме можно найти тут.

Zero-shot visual-language modeling — это та же задача zero-shot language modeling, но с добавлением картинок/видео в input. Пример: подаем на вход модели Flamingo следующее:
""
[картинка шиншиллы] -> это шиншилла. Они обитают в Чили.
[картинка фламинго] ->
""
, и Flamingo сгенерирует продолжение — текст "это Фламинго. Они обитают в Южной Америке". (см. 1 картинку к посту). Еще пример работы Flamingo: решение задачи question answering по изображению. Подаем на вход модели картинку и вопрос, связанный с ней. Модель генерирует ответ (см 2 картинку к посту).

При этом Flamingo не обучалась явно ни на одну из задач, описанных выше (распознавание животных на картинке или ответ на вопрос по изображению). Таким образом, Flamingo — действительно zero-shot visual-language model.

Об архитектуре и принуипе обучения Flamingo напишу подробный пост завтра. Пока что про модель можно почитать в блоге DeepMind и в препринте статьи. Там же больше примеров работы модели.

1.9K views14:30

Открыть/Комментировать

2022-04-30 17:30:06

2.2K views14:30

Открыть/Комментировать

2022-04-29 14:50:31 Обучить модель — это полдела. Создать стабильный полноценный сервис, чтобы вашу модель могли использовать клиенты, — вторая половина дела. Обе по-своему сложны, но не всегда равноценны =)

Если вы уже умеете обучать сети, то пора научиться создавать из них сервисы. Специалисты, которые умеют делать всю работу целиком, а не только часть, ценятся гораздо выше.

Ребята из Deep School преподают курс для тех, кто хочет научиться создавать сервисы с нуля. Они научат проходить полный путь от самого начала, когда нет даже данных, до работающего продукта.

Курс длится 12 недель. Преподаватели — опытные инженеры. Помимо создания сервисов, ребята научат вас добывать чистые данные на Толоке, правильно версионировать и логировать эксперименты, ускорять сети, настраивать CI/CD и решать задачи OCR, Face Recognition и Tracking.

Студентов ждут живые лекции в zoom, квизы, работа в группах и ревью кода. Это шанс не только учиться у опытных кураторов, но и обрести коммьюнити и поддержку.

Старт 11 мая. Почитать подробнее и оставить заявку можно по ссылке.
#промо

1.7K viewsedited 11:50

Открыть/Комментировать

2022-04-29 14:49:12 Давайте завершим цикл постов про курсы рекламой еще одного хорошего курса

1.7K views11:49

Открыть/Комментировать

2022-04-28 18:11:01 Еще по RL есть хороший русскоязычный курс от ШАДа (Яндекс). Еще я его вживую в ШАДе проходила)
Я думала, что для него нет видео лекций/семинаров в открытом доступе, а вот в комментариях к предыдущему посту сказали, что, оказывается, есть. Ищите их в папке каждого урока.

Этот курс тоже хороший. Интересно будет сравнить с HuggingFace

2.3K views15:11

Открыть/Комментировать

2022-04-28 17:55:53 Продолжая тему курсов: нас в DLS очень часто просят сделать курс по RL (или хотя бы "пару занятий по RL в конце основного курса"), но мы этого делать не будем. Среди нас нет достаточного количества специалистов по RL, да и для этой темы пары занятий недостаточно. Тут обязательно требуется полноценный курс. Но действительно хороший курс по RL сделать оочень сложно. Возможно, поэтому их не так много в интернете, как курсов по CV, NLP и подобному.

И у меня есть для вас отличная новость по этому поводу:
В мае стартует курс по RL от HuggingFace . У курса уже есть репозиторий и расписание на первые 4 занятия. И этот курс, кажется, получится правда стоящим, потому что обещают вот что:
- теория (разумеется);
- практика с использованием классических библиотек для RL;
- тренировка агентов как в классических средах (Space Invaders, PyBullet), так и в новых средах от HuggingFace;
- возможность создания своих сред;
- челленджи, в которых можно будет соревноваться в обучении агентов;
- возможность выкладывать своих агентов в hub, а также скачивать агенты других людей с хаба

Регистрация на курс здесь, репозиторий курса с информацией тут.
Если будете проходить, поделитесь потом впечатлениями, пожалуйста

2.5K views14:55

Открыть/Комментировать

2022-04-27 18:55:11 Стенфорд выложил все видосы cs224n Winter 2021 Natural Language Processing.
Это один из лучших курсов по nlp в мире, и теперь доступна его более свежая версия. Есть нормальная лекция по трансформерам, T5, low resource MT.
Всем смотреть.

https://youtube.com/playlist?list=PLoROMvodv4rOSH4v6133s9LFPRHjEmbmJ

1.1K views15:55

Открыть/Комментировать

2022-04-25 15:38:19 Ребята из фонда Teza просили передать, что у них открыты несколько вакансий. Вдруг кого-то заинтересует.

Teza — фонд, основанный Михаилом Малышевым, выпускником физтеха, и базирующийся в USA. Фонд глобальный, торгует equity, futures (включая exotics), crypto. Сейчас они ищут следующих специалистов:

- портфолио-менеджера в крипто. Эта роль предполагает прямое подчинение Мише Малышеву и возможность работать с ним напрямую.
- проектного менеджера - крипто / Портфолио менеджера Yielding. Роль предполагает координацию работы всей крипто команды (которая растет) и управление yielding продуктом, который уже в продакшене.
- senior питон-разработчика. Если вы классно программируете на питоне и вам хочется работать удаленно (предлагают Багамы, но вы можете выбрать Дубай или Тбилиси), у Teza есть классные задачи в trading operations.

Локация - Нью-Йорк или Остин, с возможностью работать в Лондоне или Дубай в будущем. Зарплата в долларах, с релокацией помогают.

Что ценят в Teza:
- Умение решать сложные задачи. Вы будете работать с победителями международных олимпиад по физике и математике, выпускниками MIT, Harvard, Princeton и т.д.
- Умение работать в команде.

Если вам хочется работать в Teza или у вас есть знакомые, которым интересна работа в глобальном фонде, пишите Тане

1.5K viewsedited 12:38

Открыть/Комментировать