Получи случайную криптовалюту за регистрацию!

Сиолошная

Логотип телеграм канала @seeallochnaya — Сиолошная
Адрес канала: @seeallochnaya
Категории: Технологии
Язык: Русский
Количество подписчиков: 43.36K
Описание канала:

Канал SeeAll'а с новостями (и мыслями о них) из мира NLP, VR и космоса.
Более подробно смотри в первом сообщении в канале (оно закреплено). А еще у нас есть чат! Заходи: https://t.me/ i_XzLucdtRJlYWUy

Рейтинги и Отзывы

1.50

2 отзыва

Оценить канал seeallochnaya и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

0

2 звезд

1

1 звезд

1


Последние сообщения 9

2023-06-03 01:10:42
Обладают ли Большие Языковые Модели моделью мира? Ну, в переносном смысле не знаю, а в прямом — да! По крайней мере, так мне кажется после прочтения статьи "GPT4GEO: How a Language Model Sees the World's Geography", где авторы из University of Cambridge и еще пары мест попытались проанилизировать географические знания модели GPT-4.

С помощью промптов, заставляющих модель выдавать координаты, цифры или текстовые инструкции было сделано множество экспериментов, начиная отрисовкий линий метрополитена и заканчивая задачками на смены часовых поясов при перелетах. И всё это — без доступа к интернету!

Первый пример, собственно, мне и понравился больше всего — его вы можете видеть на прикрепленном изображении. Видно, что модель достаточно точно воссоздала метрополитен Гонконга: какие-то линии прорисованы до мельчайших деталей геометрии, а какие-то даже не учитывают все станции.

Основная причина, по которой я захотел поделиться этим, заключается в моем желании выразить простую идею, что сейчас для экспериментов с LLM не нужны гигансткие бюджеты, так как модели теринровать и не нужно: можно обойтись смекалкой, придерживаться клевой идеи, копать вглубь и придумывать, как почелленджить модель. Главное найти ответ на вопрос "а чо еще потыкать у модели?".
24.6K viewsedited  22:10
Открыть/Комментировать
2023-06-01 20:36:13 И ещё одна инициатива, "Cybersecurity grant program"! OpenAI запускает программу грантов на кибербезопасность на сумму $1 млн с целью усовершенствования мер кибербезопасности, основанных на ИИ. Цели программы включают обеспечение специалистов из сферы кибербезопасности…
9.1K views17:36
Открыть/Комментировать
2023-06-01 20:35:49 И ещё одна инициатива, "Cybersecurity grant program"!

OpenAI запускает программу грантов на кибербезопасность на сумму $1 млн с целью усовершенствования мер кибербезопасности, основанных на ИИ. Цели программы включают обеспечение специалистов из сферы кибербезопасности передовыми средствами ИИ, количественное измерение эффективности ИИ в этой области и повышение уровня дискуссии на стыке двух наук.

В качестве идей для проектов предлагаются такие вещи, как:
— Сбор и разметка данных для обучения агентов (в контексте кибербезопасности)
— Обнаружение и смягчение социальной инженерии и её последствий
— Автоматизация отработки инцидентов
— Определение уязвимостей в исходном кодеи
— Разработка или улучшение защищенных вычислений на GPU
— Помощь пользователям в понимании и привитии лучших практик защиты от кибератак

OpenAI призывает авторов проектов делать их ориентированными на максимальную общественную пользу, с акцентом на "оборонительную" стратегию в кибербезопасности, нежели "атакующую" (не хотят давать автономным системам власть, хех).

Ссылка
9.4K viewsedited  17:35
Открыть/Комментировать
2023-06-01 19:38:30
В OpenAI пополнение: новым VP of Consumer Product стал Peter Deng.

Кто такой, чем знаменит?

— начал карьеру в Google в 2006, но быстро перешел в Facebook в 2007
— там он успел поработать над Chat'ом, а также такими фичами, как: Events, Groups и News Feed
— в 2013м стал Head of Product @ Instagram: в то время в команде было порядка 50 человек. Буквально с самого начала компании, чей MAU сейчас больше 2B, Peter трудился над продуктовым видением. В techcrunch о нем написали "Facebook’s Star Manager Peter Deng Becomes Instagram Director Of Product To “Do Fewer Things Better”". Вообще очень хорошая заметка, рекомендую ознакомиться.
— потом Peter перешел в Oculus. Тут важен не факт того, что вот, мол, человек то и это делал, а то, что Mark Zuckerberg доверял ему развивать новые перспективные и очень важные для компании продукты. Как вы понимаете, случайных и неспособных людей на такие позиции не ставят.
— ...однако в 2017м году Peter ушел в Uber, на позицию Head of Rider, существенно продвинув компанию в направлении IPO.
— дальше он перешел в Airtable, вырастав компанию до $10B. Вот тут можно найти 40-минутное интервью про его видение продукта там.

Ну и сегодня Peter присоединяется к OpenAI, чтобы помочь ей в нелегком пути дистрибуции AGI по всему свету

Источник
9.0K viewsedited  16:38
Открыть/Комментировать
2023-06-01 17:37:43




Первый официальный ролик, посвященный новой VR-гарнитуре от META: Oculus Quest 3. Я вообще большущий фанат и энтузиаст VR — мой первый шлем это картонная коробка для телефона с резинкой от трусов (чтобы на голове держалось), и очень хочу девайс себе прикупить. Будем ждать рождества или поздней осени — релиз ждет где-то там.

Из важного — гарнитура стала компактнее (тоньше почти в два раза), и теперь за графику отвечает процессор нового поколения от Qualcom. В автономном режиме без подключения теперь стоит ждать не такой вырвиглазной пиксельной картинки — уже прорыв! Но главное, как мне кажется, это что в подключенном к ПК состоянии теперь из-за более мощного чипа разные сторонние задачи будут решаться лучше: трекинг конечностей, декомпрессия изображения, улучшение качества звука, етц.

Больше деталей будет 27го сентября на ежегодном Oculus Connect.

Стартовая цена за комплектацию с 128GB памяти на борту: $499.99

UPD: а сегодня вечером в 19:30 МСК пройдет Gaming Showcase (ссылка на трансляцию), где покажут новые игры. В том числе жду новостей про GTA:SA VR, которую засветили 2 года назад, и с тех пор ничего не говорили(
8.9K viewsedited  14:37
Открыть/Комментировать
2023-06-01 13:16:59 Наткнулся на открытый пост в vas3k-клубе про изменение процедуры найма. Во мне что-то откликнулось, так как я сам сейчас активно нанимаю, уделяя от 1 до 5 часов собеседованиям в день (sic!). Приглашаю и вас ознакомиться с другой стороной, посмотреть чужими глазами на хайринг.

Вот некоторые тезисы и мои комментарии:
— Наши главные требования [к джуну или стажеру] — готовность чётко выполнять инструкции, аккуратность, способность к проверке собственных результатов, а также умение видеть смысл за числами <...> Способность следовать инструкции — больное место. Бывают ситуации, когда даёшь человеку подробные указания, что делать и как, прокладываешь ему маршрут мимо всех ошибок. Он делает иначе <...> право на творчество нужно заслужить: сначала продемонстрировать компетентность в выполнении простых задач. Ещё бывает, когда условный чек-лист дан в самой инструкции: не забудь сделать х, y, z. Если человек забывает сделать y, то это проблема.

Это вообще грустная правда, пару стажеров я не взял на джунов именно по этой причине: четко все не то что проговорено, а написано в инструкции, я потратил время, подумал за другого человека, описал подводные камни - а они все равно собраны. Тут даже не понимаю, это я дурак непонятно написал или нет.

— способность к проверке собственных результатов - штука, отчасти связанная с самооценкой, отчасти с уверенностью в себе, а еще просто с хорошими мыслительными привычками. Хорошо, чтобы человек умел сомневаться в собственных результатах, смотреть на них под другим углом, задаваться вопросом "что если?" и предполагать, что мог ошибиться, а не видеть проблемы только во внешней среде. Как пример: джун не смог найти нужные данные от клиента и ошибочно написал заказчику, что тот не выполнил обязательства по предоставлению информации, хотя ошибка на его стороне.

Для меня нежелание ошибиться и продемонстрировать незнание - это чуть ли не главные движетели. Я очень много времнеи трачу на критику своей же работы, и всегда сомневаюсь в полученных результатах (и поэтому у меня натурально горит жопа когда приходят yolo-ребята, которые не проверяют, что пишут, и уверены на 100%, что правы).

— [про домашнее задание] В данные я намеренно вложил ловушки, ошибки и моменты неопределённости, чтобы посмотреть, как кандидат с ними будет обращаться.

Этот прием мне тоже нравится, всегда применяю, даже на устных собеседованиях - спросить что-то не так, с неправильной предпосылкой, и посомтреть, как кандидат к этому придет. Или не придет...

— [при обсуждении результатов собеседований] В итоге использовали аналог <фильтров Манна> по двум ключевым критериям: "голова варит?" и "хочу с ним работать?".

Так как поток кандидатов очень большой, то нужно свести обработку результатов и приянтие решение к простой схеме. Вот эти вопросы, в целом, крутятся и у меня в голове. Бывает, что человек хорошо отвечал, но я понимаю, что это скорее точеченые знания, а не "варящий котелок", и шаг влево или вправо выбивает из колеи. Чтоб вы понимали — я нанял вот недели 2 назад инженера с минимальными навыками в нашей области (языковые модели), но как же он соображал на собеседовании! он почти на все вопросы додумал ответы, исходя из своего бэкграунда, из его понимания, и это ОЧЕНЬ круто.


Ссылка на полный текст: тык
9.2K viewsedited  10:16
Открыть/Комментировать
2023-05-31 20:47:15
Let’s Verify Step by Step (pdf)

Новая работа от OpenAI. Каждый раз сердечко замирает, как вижу уведомление от них...

Если вы смотрели мою лекцию или изучали RLHF самостоятельно, то знаете, что фидбек модели дается на весь результат целиком. Иными словами нейронка генерирует целый ответ, который после проверяется человеком или другой моделью, и получает единственную оценку. А что если оценивать промежуточные шаги, рассуждение модели? Тогда получится Process-supervised reward modelling (PRMs).

Работа большая, поэтому тезисно:
— в качестве проблемы для исследования выбираются математические задачки на несколько действий
— отдельная модель хорошо выучивает функцию оценки промежуточных шагов и может успешно использоваться в качестве критика, чтобы указывать на ошибочные суждения
— всё это приводит, конечно, к улучшению метрик
— OpenAI выкладывают датасет из 800 ТЫСЯЧ размеченных суждений (отдельных этапов решения задач)
— этот датасет собран ВРУЧНУЮ. Если для математических задачек можно столько ресурсов потратить на разметку - представьте, сколько данных собрали на всё про всё? на программирование? на открытые вопросы? Ужос...
— уже вовсю ведется дообучение GPT-4 как бейзлайн-модели, эксперименты именно над ней проводятся (причем, без RLHF-части, берется чистая языковая модель)
— упоминается, что есть несколько версий GPT-4, причем самая маленькая требует в 200 раз меньше ресурсов для обучения
— метод хорошо обобщается, в качестве валидации ему подсунули задачки с экзаменов, не похожие по формату на то, что было во время обучения, и качество там тоже увеличивается


Пример того, как модель оценивает каждый отдельный шаг решения, вы видите на скриншоте в посте. В решении справа есть ошибки, и именно им проставлена никзая оценка правильности (выделено красным).

Интересно, что OpenAI опять выкладывают инструкции для разметчиков - краудсорсервам есть чем поживиться! Внутри 2 PDF-ки по ~8 страниц.

P.S.: первый пост с нового ноутбука, как же классно на нём печатать....
9.9K viewsedited  17:47
Открыть/Комментировать
2023-05-31 18:07:45 В комментариях к предыдущему посту многие отметили темы AI Alignment и регулирование ИИ.
И неспроста!

Про риски ИИ, этику и AI Alignment мы уже записали большую беседу с Павлом Комаровским @RationalAnswer
Пока я пишу вам TLDR, вот что мы обсудили:
Почему у ИИ вообще есть какие-то риски и кто ими занимается;
Кто ими должен заниматься и почему нам нужна вычислительная этика для LLM и AGI;
Почему законы робототехники не работают
Почему open source нас всех спасёт.

Смотреть интервью:



В формате подкаста можно прослушать здесь или на Яндекс Музыке.

У Павла уже вышла целая серия материалов, которые рассказывают про языковые модели популярно, например, chatGPT.

Надеюсь, вам будет интересно послушать, а мне — почитать комментарии!
8.9K views15:07
Открыть/Комментировать
2023-05-30 23:01:39
Подъехал свежий видео-мем про очередную ML-конференцию. Ссылка: https://fxtwitter.com/postrat_dril/status/1663177876605206528 Имхо в этот раз не так смешно, но с выпуска прошлого года я умирал со смеху (ознакомиться можно тут). Пишите, сколько мемов и отсылок…
10.4K views20:01
Открыть/Комментировать
2023-05-30 22:58:49 Подъехал свежий видео-мем про очередную ML-конференцию. Ссылка: https://fxtwitter.com/postrat_dril/status/1663177876605206528
Имхо в этот раз не так смешно, но с выпуска прошлого года я умирал со смеху (ознакомиться можно тут).
Пишите, сколько мемов и отсылок поняли!


Спасибо автору @j_links за наводку.
12.9K viewsedited  19:58
Открыть/Комментировать