Получи случайную криптовалюту за регистрацию!

DLStories | Нейронные сети и ИИ

Логотип телеграм канала @dl_stories — DLStories | Нейронные сети и ИИ D
Логотип телеграм канала @dl_stories — DLStories | Нейронные сети и ИИ
Адрес канала: @dl_stories
Категории: Технологии
Язык: Русский
Количество подписчиков: 13.15K
Описание канала:

Новинки искусственного интеллекта и нейронных сетей. Разборы статей.
Ну а вообще, посчу, что захочу :)
Сотрудничество/предложения: @atmyre
Поддержать: https://t.me/dl_stories/521

Рейтинги и Отзывы

2.50

2 отзыва

Оценить канал dl_stories и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

1

2 звезд

1

1 звезд

0


Последние сообщения 3

2022-05-29 20:49:31
Смотрите, какую интересную штуку нашли у GPT-3-подобных моделей: если в zero-shot режиме добавить в конец текста запроса языковой модели фразу "Let’s think step by step", качество ее ответов улучшается в разы! Например, модель вдруг начинает уметь в логику и правильно решать арифметические задачи (см. фото к посту).
Мне кажется, это отлично демонстрирует, насколько все же далеки большие языковые модели от понимания мира и "общего разума"

Ну что, пора организовать конкурс: тюнить модели находить правильные фразы для добавления в инпут GPT-3 для решения разных задач: арифметических, логических и т.д. Выигрывает тот, чья модель сможет получить лучший средневзвешенный скор на всех датасетах для этих задач =)

P.S. Кстати, вчера было ровно два года с выхода GPT-3 в свет: 28 мая 2020 года выложили статью Language Models are Few-Shot Learners. Всего два года, а сколько всего уже успело произойти, с ума сойти!
2.6K views17:49
Открыть/Комментировать
2022-05-28 14:47:47 А вы помните, чем инициализация Xavier отличается от Kaiming?

Иногда из-за подобных вопросов приходится краснеть на собеседовании =) Если вам хочется найти канал, в котором сжато, понятно и с картинками напоминают теорию, делятся советами по обучению сетей и рассказывают про полезные библиотеки и фреймворки, то вот же он!

Подписывайтесь на DeepSchool, чтобы не забывать теорию и не краснеть

P.S. в первом посте как раз можно быстро вспомнить про Xavier и Kaiming
#промо
1.8K views11:47
Открыть/Комментировать
2022-05-27 17:21:38 Вот вам мотивашечка на выходные

(Не стала пересылать пост, потому что в нем мат, а это не всем ок)

Всем отличных выходных и вечера пятницы!
1.6K views14:21
Открыть/Комментировать
2022-05-26 14:46:43
AvatarCLIP: модель для zero-shot генерации анимированных 3D-аватаров

Вводите текстовый запрос, и модель сгенерирует 3D-анимацию. С помощью текста можно менять пол/телосложение/внешность(текстуру) героя и то, какие движения или эмоции аватар будет выражать. Можно сгенерить толстого Iron Man, грустного Стива Джобса и много всего другого. Примеры запросов и сгенерированных аватаров — на гифке к посту.

Работает это все внутри на связке CLIP для генерации формы аватара + еще несколько нейронок для генерации текстур и движений.

Полученных из модели аватаров можно скачать в .fbx формате и загрузить в Blender или Unity. Ну круто же!

Ссылки:
Статья на arxiv
Код на GitHub
Галерея готовых аватаров (можно скачать)
Демка на colab (только генерация формы и текстуры, motion пока нельзя)
1.4K views11:46
Открыть/Комментировать
2022-05-25 14:06:25
Кстати, кода и API для Imagen, как и для DALL-E 2, пока нет. Как считаете, Google выложит API в открытый доступ или поступит так же, как OpenAI?
Anonymous Poll
33%
выложит =)
67%
неа, не выложит
514 voters1.9K views11:06
Открыть/Комментировать
2022-05-25 14:04:49
Все уже видели убийцу DALL-E 2 от Google Brain?

Imagen: новая модель для офигенного text-to-image generation. Авторы утверждают, что при оценке качества генерируемых картинок людям больше нравятся картинки от Imagen, а не DALL-E 2!

Imagen — это диффузионная модель, как и DALL-E 2. Главное ее отличие в том, как она получает эмбеддинг текста для подачи на вход диффузии. Авторы Imagen используют для этого предобученную языковую модель T5 (см. 2 картинку). Эмбеддинг из T5 подается как condition на вход диффузионной модели, которая генерирует картинку размера 64х64. Далее эта картинка проходит через еще две диффузионные модели для super resolution, которые увеличивают разрешение до 256х256 и далее до 1024х1024.

То есть главное открытие Imagen — это что огромная предобученная языковая модель выдает очень хорошие эмбеддинги текста, по которым диффузионная модель может научиться генерировать очень крутые картинки.

Больше примеров картинок и деталей устройства в блоге Google и в статье на arxiv.
2.1K views11:04
Открыть/Комментировать
2022-05-24 09:01:07
На картинке 12 терминов. Сколько из них вы можете объяснить?

Если больше 10 - то вы молодец
Если меньше - то у вашей карьеры или бизнеса хреновое будущее

Это поправимо. Достаточно 2 минуты в день читать этот канал, который ведут эксперты АНО "Цифровая экономика", и вы быстро войдёте в курс необходимых в 2022 году знаний о цифровизации бизнеса. Как минимум, сможете блеснуть на собеседовании. Как максимум - сможете перезапустить бизнес.

А ещё там подписчикам раздают чек-листы по цифровизации и топовые книги.

Подписывайтесь по этой ссылке: https://t.me/cdo2day.
#промо
1.8K views06:01
Открыть/Комментировать
2022-05-23 22:20:58
Развлечение перед сном: попробуйте определить, нарисованы ли картинки человеком или сгенерированы с помощью DALL-E 2
https://thisimagedoesnotexist.com/

Мой результат 9/10 (дальше стало лень думать)
2.3K viewsedited  19:20
Открыть/Комментировать
2022-05-22 20:05:27 Сбер выкатил две новые нейронки: Рирайтер и Суммаризатор.

Первая (Рирайтер) переписывает заданный текст другими словами, стараясь при этом сохранить его смысл. Вот пример работы:

Исходный текст:
""Вася Пупкин довольно скептично отнесся к выставке арта, сгенерированного с помощью искуственного интеллекта. Вася считает, что машина не может творить, ведь у нее нет души, а все, что она делает — это копирует шедевры человека""

На выход Рирайтер дает пять вариантов переформулировки. Вот один из них:
""Вася Пупкин не одобряет арт-проект, созданный с помощью искуственного интеллекта. Вася считает, что машина не может творить : у нее нет души и она копирует только шедевры человека.""

Вторая нейронка (Суммаризатор) пытается сократить поданный на вход текст, опять же, не теряя при этом смысл. "Пытается", потому что выдаваемый ею текст не всегда получается короче, а иногда даже и длиннее) Но, может быть, это мне с моими запросами так не повезло, а вам повезет больше.

В целом, отправив запросов пять в каждую из моделей, я не могу сказать, что восхищена. Хотя, Рирайтер довольно неплох: действительно переписывает текст немного другими словами. Может быть полезно, если нужно переформулировать пару предложений в тексте, а идей как-то нет.

Потыкать в них можно тут:
Рирайтер
Суммаризатор
На странице нажимаете на зеленую плашку "Post", затем "Try it out", в окне вписываете в поле "text" свой запрос, жмете "Execute" и ждете. Через пару секунд получаете ответ в поле ниже.
1.8K viewsedited  17:05
Открыть/Комментировать
2022-05-21 18:07:19 Как вы, наверное, знаете, OpenAI не выложил код DALL-E 2 в открытый доступ. Даже API, где можно отправить запрос и получить по нему картинку, не публичный — доступ к нему имеют лишь несколько тысяч человек.

Очень забавно видеть то, как компания под названием OpenAI закрывает доступ к своим моделям. Кажется, что это немного противоречит той идее, с которой эта организация создавалась:

"Илон Маск и Сэм Альтман запустили OpenAI в конце 2015 с целью создать открытую компанию, работающую на благо общества, а не государства или корпорации. Открытость призвана избежать концентрации власти, которую даёт ИИ, в одних руках. В планах компании открыто сотрудничать со всеми лицами и учреждениями, публиковать все результаты своих исследований"

И вот теперь OpenAI концентрирует власть над DALL-E 2 в одних руках — своих =)

А еще многие полагают, что OpenAI нехило так на DALL-E 2 хайпует, выдавая доступ к API небольшим группам людей по чуть-чуть и подогревая интерес. Да еще и большинство из людей, получивших доступ — инфлюенсеры, которые могут раскрутить интерес к модели еще сильнее.

Ну и, вишенка на торте — в одном из последних апдейтов про API DALL-E в организации заявили, что проверяют запросы пользователей на "violation of content policy". А тех юзеров, кто генерирует "неподобающие" картинки, лишают доступа к API. На мой взгляд, это тоже как-то не согласуется с идеей openness =(

А что вы думаете по этому поводу? Поддерживаете такую политику OpenAI относительно DALL-E 2? Или считаете, что должно быть по-другому? Правда очень интересно.

P.S. Мы недавно записывали новый выпуск подкаста, в котором также затронули эту тему. Его скоро (надеемся) смонтируют, и выложим =)
2.3K viewsedited  15:07
Открыть/Комментировать