Получи случайную криптовалюту за регистрацию!

DeepLearning ru

Логотип телеграм канала @deeplearning_ru — DeepLearning ru D
Логотип телеграм канала @deeplearning_ru — DeepLearning ru
Адрес канала: @deeplearning_ru
Категории: Технологии
Язык: Русский
Количество подписчиков: 2.25K
Описание канала:

Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience
По рекламе писать @miralinka,
Admin @salavatov
Группа в ВК https://vk.com/deeplearning_ru

Рейтинги и Отзывы

3.00

3 отзыва

Оценить канал deeplearning_ru и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

2

3 звезд

0

2 звезд

0

1 звезд

1


Последние сообщения 4

2022-01-12 19:18:10
Вы руководите стартапом в сфере искусственного интеллекта или, может быть, работаете в секторе Интернета вещей или индустрии дополненной реальности? Нажмите здесь и узнайте, как вы можете воспользоваться программой Европейского Союза, не находясь в ЕС. Завоевать новых клиентов и новые контакты на европейском рынке. Ознакомьтесь с программой Poland Prize
https://technopark.kielce.pl/polandprizerus/
446 views16:18
Открыть/Комментировать
2021-12-13 18:08:22
Начать разбираться в AI и ML — легко!

Смотрите, какой крутой проект — YouTube-канал "Академия искусственного интеллекта". Это совместный проект Сбера и Благотворительного фонда "Вклад в будущее". Цель проекта — помочь разобраться, что такое искусственный интеллект и машинное обучение. В коротких видео понятным языком рассказывают о новых веяниях ИИ, об олимпиадах, стажировках и хакатонах; а также дают много полезных ссылок и материалов, которые помогут лучше разобраться в теме.

Вот несколько интересных видео:
- Нейросеть DallE от Сбера: интервью с одним из создателей.
- Почему ИИ стоит изучать.
- Стажировка в Сбере.
- Как достичь успеха в data science и IT

В 2021 изученим AI и ML действительно стоит начать заниматься уже сейчас: чтобы не отодвигать изучение самой развивающейся сферы в мире и стать в ней первым!
Академия ИИ докажет вам, что AI — это суперувлекательно! Подписывайтесь
342 views15:08
Открыть/Комментировать
2021-11-24 09:38:04
Для участия в Sibur Challenge 2021 срочно ищем data scientist и digital-специалистов, работающих с алгоритмами машинного обучения!

Призовой фонд 650 000 рублей.
Одна задача. 5 призовых мест.
Регистрация и telegram-чат участников уже открыты!
https://bit.ly/3kgP555

Что вас ждет:
» Работа с реальной задачей от СИБУР Диджитал, IТ-компанией нефтехимической группы СИБУР;
» Поддержка и ответы на вопросы - в чате и на субботних вебинарах;
» Возможность объединяться в команды;
» Прямой доступ к ведущим экспертам индустрии;
» Возможность получить приглашение на работу или стажировку;
» Дополнительные вознаграждения за активности;
» Общение с единомышленниками;
» Финальная презентация решений победителей;

Подай заявку на участие!
https://bit.ly/3kgP555
Добавляйся в чат и в числе первых получай доступ к данным по задаче!
405 views06:38
Открыть/Комментировать
2021-11-19 16:09:24 Привет!
Команда Cameos ищет крутого ML разработчика в лондонский офис Snapchat. Вас ожидают state-of-the-art computer vision задачи (https://www.thesun.co.uk/tech/13383120/snapchat-rolls-out-cartoon-lens/). Полагаются все плюшки работы в большой компании, при этом мы еще сохраняем дух стартапа внутри (компания AI Factory была недавно куплена Snap). Через год возможен relocation в Лос-Анджелес 
Желающие попробовать свои силы пишите @akovalenko7
452 views13:09
Открыть/Комментировать
2021-11-08 20:49:24 [OpenAI DALL·E] Zero-Shot Text-to-Image Generation
Aditya Ramesh, Mikhail Pavlov, Gabriel Goh, Scott Gray, Chelsea Voss, Alec Radford, Mark Chen, Ilya Sutskever
Статья: https://arxiv.org/abs/2102.12092
Пост в блоге: https://openai.com/blog/dall-e/
Код (официальный, но неполный): https://github.com/openai/dall-e
Код (неофициальный, но более полный): https://github.com/lucidrains/DALLE-pytorch
Обученная модель от Сбера: https://github.com/sberbank-ai/ru-dalle

В последнее время появилось много мультимодальных трансформеров, и хочется их поразбирать. Нельзя обойти при этом наиболее известные модели, одна из которых — DALL·E от OpenAI.

DALL·E прошумел уже довольно давно, в самом начале года, но статья и все детали реализации стали доступны не сразу (в официальной репе так вообще лежит только обученный dVAE, который лишь часть от DALL·E).

Собственно, что такое DALL·E? Это декодер трансформера, который авторегрессионно умеет генерить изображения, “продолжая” заданное текстовое описание и, возможно, начальную часть изображения.

В оригинальном посте было заявлено, что это 12-миллиардная версия GPT-3, обученная на парах картинок и их описаний, но реальность сильно сложнее.

Начать стоит с того, что процесс обучения двухэтапный. На первом этапе обучается дискретный VAE (dVAE), сжимающий входную картинку 256*256 в картиночные токены на сетке 32*32, принимающие 8192 возможных значения каждый (то есть размер словаря). Это нужно для того, чтобы уменьшить количество токенов, с которыми должен дальше оперировать трансформер, и даёт уменьшение размера контекста в 192 раза. Часть высокочастотного сигнала в изображении при этом, ожидаемо, теряется, мелкие детали становятся плохо- или неразличимы, но в целом качество восстановления картинки после такого dVAE вполне достойно. Именно отсюда получается та самая своеобразная гладкость генеримых DALL·E картинок и проблемы с мелкими деталями, соответственно не для любого типа изображений DALL·E подходит, либо же процесс требует переобучения dVAE на более специальные кейсы. В dVAE никаких трансформеров нет, это свёрточный резнет.

Второй этап — это собственно трансформер. 256 кодирующих текст BPE-токенов (словарь размера 16384) конкатенируются с 1024 картиночными токенами, полученными от dVAE, и эта последовательность авторегрессионно продолжается. Сам трансформер это 64-слойный sparse transformer от тех же OpenAI (https://arxiv.org/abs/1904.10509). Он хитрый, в нём три типа шаблонов внимания: 1) text-to-text классический masked механизм как в авторегрессионных языковых моделях по типу GPT, где текущий токен не имеет права заглядывать в будущие токены; 2) image-to-text, где каждый токен изображения смотрит на все токены текста; и 3) image-to-image, где используются паттерны из sparse transformer с вниманием по строкам, столбцам и более хитрыми свёрточными шаблонами, которые применяются только в последнем self-attention слое. При этом все три типа заведены в одну единственную операцию внимания, потому что это работало лучше, чем три отдельные операции.

Авторы сначала экспериментировали на маленькой модели в 1.2B параметров и датасете в 3.3M пар картинка-текст, а потом отскейлили это на 12B модель и датасет в 250M пар (который пришлось собрать). Собственно этот скейлинг и составляет главные идейную и техническую часть работы. Идейно — показать, что обученная на большом датасете модель большого размера демонстрирует интересное поведение, а технически — заставить всё это работать, потому что вылезает много инженерных челленджей, не проявляющихся на меньших масштабах.

По признанию авторов, самая сложная часть проекта была в том, чтобы обучить большую модель на 16-битных числах (вместо обычных 32-битных). Было много всяких нестабильностей, поэтому авторы придумали хитрые методы масштабирования градиентов для защиты от underflow. Другой челлендж — распределённое обучение, где использовался тонко настроенный вариант PowerSGD. За этими (на самом деле важными, если хотите повторить) техническими деталями обращайтесь в Appendix.
470 views17:49
Открыть/Комментировать
2021-10-28 23:10:40 XTechnology - Real Data Science Project end-to-end: use-case in banking & collection

Date: 30 October, 10am CEST
Location: Online
Price: Free
Theme: #machine_learning #datascience #finance #data_analytics

The potential of Data Science in debt collection has not been explored thoroughly. Hence, there is huge room for establishing the best practices in machine learning and data engineering.

Starting from an initiation phase where business struggles with a particular problem. Up to an implementation phase where a cross-functional team can deliver direct value to the company. This talk will encourage you to use an analytical approach in the financial domain by showing a comprehensive picture of a data science project.

Website: https://www.eventbrite.co.uk/e/real-data-science-project-end-to-end-use-case-in-banking-collection-tickets-193442370337?aff=telegram
210 views20:10
Открыть/Комментировать
2021-10-21 12:36:35
29-31 октября пройдет онлайн-хакатон EVRAZ AI Challenge от международной горно-металлургической компании EVRAZ

Узнайте на хакатоне, чем айтишники занимаются в промышленности, а также ...

Продуйте металл через Data Science;

Разработайте компьютерное зрение для контроля опасных зон агломашины;

Станьте частью команды EVRAZ;

Прокачайте свои скиллы вместе с экспертами EVRAZ.

Приглашаем принять участие всех, кому интересен Data Science и Computer Vision,

Призовой фонд — 500 000 рублей

Регистрируйтесь до 26 октября 23:59 по ссылке:https://clck.ru/YKDQY
Обязательно приглашайте друзей и добавляйтесь в Telegram-чат, чтобы найти единомышленников: https://clck.ru/XzPqB
412 views09:36
Открыть/Комментировать
2021-10-20 13:30:53
PlayButton: большая конференция Яндекса о видео

Большая онлайн-конференция Яндекса, посвященная видео в интернете, пройдет 24 октября. Эксперты из Яндекс.Дзена, Кинопоиска и IVI расскажут о рекомендациях и доставке видео, Low Latency, параллельном транскодировании, QoS-метриках и особенностях склейки дублей. Регистрируйтесь, программа дополняется.

Регистрация
324 views10:30
Открыть/Комментировать
2021-10-13 10:58:44
Вебинар Бесплатный ML Space на базе инструментов Intel oneAPI для всех желающих.

У нас отличные новости, инструменты Intel oneAPI на облачной платформе ML Space стали доступны для физических лиц. Это значит, что любой желающий может бесплатно использовать набор программных инструментов для ускорения машинного обучения, анализа данных, разработки ПО.

На вебинаре вы узнаете:

— подробности об инструментах Intel oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.

Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.

Вебинар пройдёт — 14 октября 2021, четверг, 12:00

*SberCloud — облачный провайдер услуг и сервисов для физлиц, бизнеса и государственных организаций.
437 views07:58
Открыть/Комментировать
2021-10-07 15:50:38
8-11 ноября NVIDIA проводит свою конференцию в области ИИ, технологий и графики NVIDIA GTC. Конференция сейчас проходит онлайн, и участие в ней бесплатное. GTС объединит главных отраслевых экспертов, которые расскажут о самых актуальных разработках по направлениям AI&Deep Learning, Robotics, Automotive, GPU programming, Data Science, Graphics и др, а также о непосредственном применении этих технологий в различных сферах бизнеса. Всего в программе будет более 500 технологических сессий, включая выступления спикеров из OpenAI, PayPal, Tencent, Hugging Face, Amazon, Daimler Trucks, University of Oxford, Epic Games, Walmart, Mavenir а также МТС, Яндекс и стартапов-участников программы NVIDIA Inception. Помимо этого, конечно же, ждем keynote CEO NVIDIA Дженсена Хуанга, который традиционно рассказывает об основных трендах на рынке и анонсирует все самые важные новости NVIDIA. Поизучать программу и зарегистрироваться для бесплатного участия можно тут: https://nvda.ws/3CTlZiP
452 views12:50
Открыть/Комментировать