Получи случайную криптовалюту за регистрацию!

LEFT JOIN

Логотип телеграм канала @leftjoin — LEFT JOIN
Адрес канала: @leftjoin
Категории: Технологии
Язык: Русский
Количество подписчиков: 74.85K
Описание канала:

Просто и понятно про анализ данных, технологии, нейросети и, конечно, SQL.
Медиакит проекта — leftjoin.ru/files/leftjoin_mediakit.pdf
Блог — leftjoin.ru
YouTube Дата Коля — tapthe.link/FjT7oV21N
Услуги — valiotti.com
Автор — @valiotti

Рейтинги и Отзывы

4.50

2 отзыва

Оценить канал leftjoin и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

1

4 звезд

1

3 звезд

0

2 звезд

0

1 звезд

0


Последние сообщения

2024-05-03 10:31:16
Введение в современную статистику: бесплатный онлайн-учебник
Учебники и любая профессиональная литература — дорогое удовольствие, поэтому, когда удается найти что-то крутое за бесплатно, этим надо делиться.

Это и сделаем.

На сайте проекта OpenIntro выложили второе издание учебника «Introduction to Modern Statistics». Оно все еще в работе, обновляется и дописывается, но пользоваться уже можно. Первое издание лежит рядом на том же сайте.

Учебник рассчитан на начинающих изучать статистику. Он знакомит с основами работы с данными, методами анализа и визуализации.
Текст состоит из теории, разборов кейсов и упражнений на закрепление материала.
Первое издание можно скачать в pdf, второе пока нет, но оба удобнее читать в браузере. Книги специально сверстаны именно для этого.
Важное примечание: текст на английском, переводов на другие языки нет.

Если хотите начать изучать статистику — это неплохой (и доступный!) вариант для старта.

И, кстати, на OpenIntro есть и другие бесплатные учебники по математике и статистике. Большинство из них рассчитаны на студентов вузов.
30.7K views07:31
Открыть/Комментировать
2024-05-02 10:30:49
Интернет против ИИ-контента
В конце марта YouTube оповестил, что теперь авторы видео должны будут отмечать ИИ-контент.

Под это правило попадают ролики, которые могут ввести в заблуждение ­— то есть в них есть реалистичные сгенерированные изображения реальных людей, мест и событий. Откровенно фантастические вещи, ИИ-фильтры и спецэффекты отмечать не надо будет.

Если вы сгенерировали видео, где Билли Айлиш поджигает Белый дом, то его надо будет тегнуть как AI-generated. Если то же самое будет делать Геральт из Ривии, без тега можно обойтись.

Это не первая платформа, которая начала отмечать ИИ-контент. Еще раньше это сделал TikTok, а Meta (та самая, которая признана экстремистской и запрещена в РФ) пообещала начать тегать сгенерированные изображения, видео и аудио уже в этом месяце.

Все объясняют это решение борьбой за прозрачность и против дезинформации. И обещают, что если авторы не будут ставить нужные теги, то сделают это сами, а то и вовсе удалят подозрительный контент с сайта.

Интернет давно заполнили картинки и видео, сгенерированные нейросетями: от невинных и даже любопытных экспериментов в стиле «Summertime sadness в исполнении Фрэнка Синатры» до наделавших шуму фейков вроде Папы Римского на стиле. Некоторые сайты, например, все тот же Facebook (тоже признан экстремистским и запрещен), утопают в низкокачественных ИИ-картинках, которые генерируют и постят боты для ботов. В общем, попытки регулировать происходящее понятны. Правда, поток подобного контента такой большой, что пока непонятно, будет ли от этих попыток эффект.

Что думаете — будет польза от этих мер? И как вы относитесь к ИИ-контенту?
20.4K views07:30
Открыть/Комментировать
2024-04-30 10:27:01
HEART: от Google с любовью
Недавно рассказали про AARRR — маркетинговый фреймворк для стартапов. Сегодня поговорим про систему метрик, которую могут применять продуктовые отделы для оценки пользовательского опыта. С ее помощью можно оценить, насколько успешен продукт (приложение, сайт, сервис) в целом либо его отдельные фичи.

Фреймворк разработали в Google и назвали HEART У них даже есть целая публикация про него. Как и в прошлый раз, название — это акроним. За каждой буквой скрывается то, что мы будем измерять.

H — Happiness, счастье: насколько пользователи довольны продуктом.
E — Engagement, вовлеченность: как часто и как долго используют продукт.
A — Adoption, принятие: насколько активно пользуются продуктом: устанавливают, делают покупки, скачивают обновления.
R — Retention, удержание: насколько хорошо продукт удерживает пул постоянных пользователей.
T — Task Success, успех задачи: помогает ли продукт решить задачу пользователя.

Для каждой категории надо определить цели, сигналы и метрики. Для этого проще всего нарисовать табличку, как здесь.

Цель — это к чему вы стремитесь. «Приложение должно быть удобным и понятным» — это цель для строчки Happiness.
Сигналы — это ваши источники информации. Устраивает ли пользователя приложение, вы можете узнать из опросов, отзывов, оценок в магазинах вроде App Store.
Метрики — это показатели, которые вы можете измерить в цифрах, чтобы понять, достигаете ли вы своих целей. С помощью опросов можно посчитать NPS, а в магазинах приложений — увидеть свой рейтинг и процент хороших оценок.

В идеале так нужно пройтись по каждой букве HEART. В итоге вы получите довольно простой и эффективный способ «держать руку на пульсе» и отслеживать настроения своих пользователей.
15.4K views07:27
Открыть/Комментировать
2024-04-29 10:31:02
Периодическая таблица датавиза
Лучший способ рассказывать про датавиз ­— это с помощью датавиза!

В периодической таблице методов визуализации собрали все возможные способы представить информацию на схемах, графиках и картинках — от обычных пай-чартов до комиксов.

Цвет ячейки показывает на предназначение метода.
Цвет названия — на то, что визуализируется: процессы или взаимоотношения внутри структуры.
Дополнительные значки говорят об особенностях метода: например, помогает ли он увидеть ситуацию в целом или оценить детали.

Таблица даже немного интерактивная — можно навести мышь на ячейку, и выскочит окошко с картинкой-примером. Она довольно старая — аж из 2007 года — но актуальность не потеряла.

Кстати, если хотите побольше почитать про разные способы визуализации данных, у нас есть крутой пост про 250 лет развития датавиза.
16.9K views07:31
Открыть/Комментировать
2024-04-26 10:31:14
Чем на самом деле занимаются аналитики?
Начинать карьеру в новой сфере всегда сложно. IT-курсы чаще всего помогают подтянуть харды — например, знание Python или SQL — но мало рассказывают о том, как устроена профессия изнутри.

Как строится взаимодействие с коллегами из других отделов?
Как выглядят реальные повседневные обязанности и задачи?
Стоит ли вообще лезть в эту новую сферу, и будет ли работа в ней на практике такой же интересной, как кажется со стороны?

Курс «Марафон данных» мы написали, чтобы помочь всем, кто задумывается о карьере в аналитике, найти ответы на эти вопросы. Он бесплатный и довольно короткий — на прохождение понадобится около 10-15 часов.

Его задача — познакомить с реалиями работы в дата-команде. Ну и заодно рассказать про с основы Python, SQL, работу с базами данных и главные продуктовые метрики.

После этого курса вы не станете профи в аналитике, но зато увидите, что ждет вас впереди. Вы посмотрите на реальные данные, с которыми приходится работать, и выполните ряд задач, максимально приближенных к «боевым». Это поможет понять, подходит ли вам профессия аналитика, и заложить фундамент для дальнейшего обучения.

Но мы вспомнили про этот проект не просто так. Во-первых, мы, конечно же, хотим рассказать о нем новым подписчикам или старым, которые могли пропустить предыдущие посты о нем. А, во-вторых, потому что на одном курсе мы решили не останавливаться и сейчас работаем над еще одним! Он тоже для новичков, но более сложный. Проходить его будет проще с базой, которую дает «Марафон данных».
14.0K views07:31
Открыть/Комментировать
2024-04-25 19:05:14
Только новости, и ничего лишнего
Мы тут рассказываем про технологии и данные, и что-то новое в этой сфере появляется каждый день. В потоке новостей легко потеряться, поэтому ребята из канала SM only news каждый день отбирают только самое важное.

Например, вот новости последней недели, которые вы могли пропустить:
В Tinder появилась функция «Поделиться свиданием»
Neiry представила наушники для улучшения настроения совместно с НМИЦ ПН им. В. М. Бехтерева
Nothing представила наушники с поддержкой ChatGPT

Канал строго про новости — публикуют оперативно, пишут без воды про все важное, обсуждаемое и актуальное из мира бизнеса, технологий и массовой культуры.
20.4K views16:05
Открыть/Комментировать
2024-04-25 15:15:23
Ищем дата-инженера в Valiotti Analytics!
Наша команда продолжает расширяться — в ней вновь появилось место для дата-инженера уровня Middle.

Мы (если вы вдруг забыли) — дата-агентство Valiotti Analytics. Работаем с 2019 года и делаем крутую аналитику digital-компаниям из США, Европы и России.

От нас:
Фуллтайм на удаленке,
Достойная зарплата, которую обсуждаем индивидуально с каждым кандидатом,
Корпоративный английский,
Классная команда и крутые задачи.

От вас:
Опыт работы дата-инженером от 1 года,
Знание ClickHouse, SQL, Python, Apache Airflow 2 и bash.

Больше про обязанности и наши ожидания от кандидата читайте на странице вакансии. А если вам уже все ясно и вы готовы откликнуться, присылайте резюме на почту saveleva.a@valiotti.com (в письме укажите, пожалуйста, свой ник в Telegram) или напрямую @alena_savelevaa.
22.1K viewsedited  12:15
Открыть/Комментировать
2024-04-24 10:30:38
Угадайте код RGB: тест для дизайнеров и не только
Мы тут, конечно, собрались, чтобы говорить про данные, аналитику, IT и прочие штуки на острие прогресса, но давайте честно: иногда хочется просто потыкать в кнопочки.

Специально для этих целей принесли вам игру Guess My RGB. Суть проста: фон страницы окрашивается в рандомный цвет, код которого надо угадать, крутя ползунки, отвечающие за красный, зеленый и голубой цвета.

Количество попыток не ограничено, так что тыкать в кнопочки можно бесконечно. Самое то, когда нужно немного разгрузить мозг.

Делитесь успехами в комментариях — получается угадывать?
20.3K views07:30
Открыть/Комментировать
2024-04-23 10:52:01
Цвет в визуализации данных
Датавиз — область работы с данными, где заботиться надо не только о точности, но и эстетике. Чтобы графики выполняли свою функцию, они должны быть понятными, легко читаемыми и приятными глазу. Из-за этого, если нет опыта в дизайне, иногда может быть неясно, с какой стороны подходить к визуализации. К счастью, есть общие принципы, которые помогут разобраться, как надо и не надо делать, даже если у вас нет особых художественных способностей.

О них рассказывает книга «Основы визуализации данных». На vc.ru выложили отрывок из нее про цвет и частые ошибки при работе с ним.

Ошибка: слишком много цветов, каждый элемент раскрашен по-разному. Например, на графике много точек, и все разных оттенков. Оптимальный вариант — когда у вас 3-5 категорий элементов на графике, и у каждой свой цвет. Если их больше, то надо искать другие способы маркировки.

Ошибка: раскрашивание ради раскрашивания, чтобы получилось красивенько, а не удобно. Может идти в комплекте с другой проблемой— слишком яркие цвета, особенно если ими закрашены большие области. У цвета в датавизе есть функция: он должен привлекать внимание к самым важным частям графика и помогать с одного взгляда разобраться, где значения больше, а где меньше.

Ошибка: игнорирование людей с нарушениями восприятия цвета — чаще всего люди с дальтонизмом не различают красный и зеленый либо синий и зеленый. В качестве одного из решений автор книги приводит специально разработанную шкалу из 8 цветов, которые различают все. Даже если человек не воспринимает какие-то оттенки, он увидит как минимум разницу в яркости.
29.3K views07:52
Открыть/Комментировать
2024-04-22 12:22:01
Все дороги ведут к базам данных
Есть теория, что эволюция рано или поздно всех живых существ превращает в крабов. На самом деле только членистоногих, но это уже не так смешно звучит.

А вот Тайлер Клотье, основатель Clockwork Labs, написал про то, что если вы придерживаетесь дата-ориентированного подхода в программировании, все, что вы делаете, рано или поздно превратится в базу данных. Этакий краб от мира данных, идеальная форма, к которой стремится эволюция.

Компания Тайлера разработала SpacetimeDB и даже сделала на ее основе игру, так что можно предположить, что он в этом вопросе несколько пристрастен. Но его опыт позволил предложить интересный взгляд на данные.

Для интересующихся добавили ссылки на полезные статьи по теме.

Дата-ориентированное проектирование (data-oriented design, DOD) — это подход к программированию, нацеленный на максимально эффективную организацию хранения и обработки данных. Он часто применяется при разработке игр.

В основе DOD лежит принятие того факта, что цель любой программы — трансформация данных, а наша цель — найти лучший способ, как эту трансформацию произвести.

Один из примеров DOD — это Entity Component System или ECS, архитектурный паттерн, который также используется в разработке игр. Он строится на сущностях (Entity), которым присваиваются свойства или компоненты (Component). Система (собственно, System) — это логика, по которой сущности взаимодействуют.

Тайлер показал, что ECS — это разновидность реляционной модели данны, и продемонстрировал, как кусок кода, написанного согласно ECS, можно воспроизвести в PostgreSQL.

У ECS есть свои внутренние ограничения, из-за которых его бывает не слишком удобно использовать вне разработки игр. Но суть не в этом, а в том, что он показывает, как любую программу и даже игру можно воспринимать как базу данных и к разработке подходить соответственно.

В общем, данные — прежде всего.
41.8K views09:22
Открыть/Комментировать