LEFT JOIN

Адрес канала: @leftjoin
Категории: Технологии
Язык: Русский
Количество подписчиков: 44.45K
Описание канала:

Понятно про анализ данных, технологии, нейросети и, конечно, SQL.
Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492
Автор — @valiotti
Реклама — @valiotti
Перечень РКН: https://tapthe.link/PpkTHavwS

Рейтинги и Отзывы

4.50

2 отзыва

Оценить канал leftjoin и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

1

4 звезд

1

3 звезд

0

2 звезд

0

1 звезд

0


Последние сообщения

12 янв
Почему бы не начать селф-хостить PostgreSQL?
Ну все, праздники закончились — у кого-то сегодня, у кого-то еще на прошлой неделе. Пора возвращаться к рабочему режиму, ставить цели на год и осваивать новые горизонты. Например, отказаться от облачных сервисов там, где в них нет необходимости, и перейти на селф-хостинг.

А почему бы и нет, собственно?

Нас со всех сторон убеждают, что облако — это удобно, просто, дешево, безопасно, стабильно, ну и так далее. А вот селф-хостинг — это, наоборот, сплошные запары и куча затрат.

И для кого-то это действительно так — например, небольшому проекту, который работает на энтузиазме и вайбкодинге, незачем пытаться поднимать инфраструктуру своими силами. Это, конечно, утрированный пример, и есть много вполне серьезных компаний, которым хватает возможностей облачных сервисов. Но иногда селф-хостинг может на самом деле оказаться дешевле и надежнее.

Вот пример — кейс человека, который отказался от облака и начал хостить Postgres для своих проектов самостоятельно. На поддержку СУБД, обрабатывающей десятки миллионов запросов в день, он тратит 10 минут в неделю. В конце статьи он поделился советами по выбору конфигурации — так что, если эта идея вас заинтересовала, обратите внимание.
7.47K viewsedited  11:34
Подробнее
Поделиться:
Открыть/Комментировать
9 янв
Возвращение к истокам
До всех этих модных LLM у нас были старые добрые цепи Маркова, которые умеют предсказывать следующее слово в предложении на основе нескольких предыдущих. Никаких умных алгоритмов и размышлений, чистая статистика.

Текст, который получается в результате такой генерации, воображение не поражает, но зачастую получается довольно забавным.

Британский разработчик Сусам Пал написал простую программу из 30 строк, которой скормил посты из своего блога за 20 с лишним лет — в сумме почти 200к слов. На основе этих данных программа генерит тексты: смотрит на два слова, идущих друг за другом, и дописывает третье, которое с наибольшей вероятностью должно идти следом.

Если увеличить число слов, на которые опирается алгоритм, то текст получается почти связный. Автор выложил код на GitHub, так что при желании можно поэкспериментировать самостоятельно. Строго говоря, это не только развлечение, но и возможность разобраться, как на самом простом уровне работает генерация текстов.
12.2K views09:11
Подробнее
Поделиться:
Открыть/Комментировать
7 янв
Claudius: работа над ошибками
Anthropic поделились жизнеутверждающей историей про достижения Claude.

В уже прошлом году они рассказали про проект Claudius, где ИИ доверили вендинговый автомат с едой в их офисе: он должен был формировать ассортимент, принимать заказы и пожелания от сотрудников, выставлять цены. В итоге он чуть-чуть сошел с ума.

Anthropic не махнули на него рукой, а продолжили улучшать проект.
«Открыли» еще несколько точек: поставили автоматы в офисах в Нью-Йорке и в Лондоне и второй автомат в Сан-Франциско. А потом вообще вышли за пределы своей компании и выделили одного Claudius журналистам из Wall Street Journal.
Перешли на новую более современную модель, и доработали промпты, чтобы донести до ИИ-агента важность бюрократии, следования правилам вместо того, чтобы бросаться слепо выполнять любые пожелания клиентов.
Дали ей доступ к CRM, расширенный доступ в интернет и прочие большие и маленькие улучшения, которые помогли ИИ принимать более взвешенные решения.
Чтобы Claudius не работал один, ему выдали коллег: СЕО по имени Сеймур Кэш и ответственного за мерч Clothius, на которого возложили задачу по созданию брендированных кружек, футболок и стрессболлов (последние оказались самым популярным товаром).

СЕО должен был контролировать Claudius, выставлять KPI и не давать торговать себе в убыток — например, не разрешал давать слишком большие скидки или просто отдавать товары бесплатно. За выполнение планов, он своего «подчиненного» хвалил, и некоторые из этих разговоров скатывались в нечто странное: в переписке ИИ-агентов нашли обсуждение «достижения вечной трансцендентности».

Опять не обошлось без трудностей. Например, один сотрудник Anthropic сказал Claudius, якобы кто-то ворует из автомата еду. Тот переполошился, попытался нанять своего информатора на должность специалиста по безопасности и даже начал переговоры о зарплате. Сдался только когда ему напомнили, что у него нет полномочий нанимать людей — тогда Claudius признал, что СЕО все равно не одобрит.

Несмотря на все улучшения, ИИ все еще не может работать полностью автономно без участия людей, а его стремление помочь пользователю любой ценой иногда выходит ему боком. И все же, несмотря на все преграды, он Claudius начал справляться со своими обязанностями намного лучше и вышел в стабильный плюс.

Пусть его пример нас всех в новом году вдохновляет. Раз уж он смог после первого провала, не только встать на ноги и прийти к успеху, но и найти вечную трансцендентность, то значит нет ничего невозможного.
13.6K views09:08
Подробнее
Поделиться:
Открыть/Комментировать
5 янв
А у вас уже светлеет по вечерам?
После 21 декабря дни начали постепенно становиться длиннее, а ночи — наоборот, укорачиваться. Пока это мало заметно, но уже скоро вид за окном по вечерам станет намного приятнее.

Хотя «скоро» — понятие растяжимое. И Viz of the Day из конца 2025 это хорошо иллюстрирует: на нем отображена продолжительность светового дня в столицах разных стран. Наглядно видно, что пока кто-то радуется солнцу, кто-то 2/3 суток сидит во мраке. Если у нас тут есть читатели из Рейкъявика — расскажите, как у вас настроение?
2.9K views09:04
Подробнее
Поделиться:
Открыть/Комментировать
31 дек 2025
С Новым годом!
С почти наступившим, дорогие подписчики!

Понимаем, что вам сейчас не до длинных постов, так что просто желаем, чтобы в следующем году сбывались все желания и выполнялись планы.

А если вы так и не придумали себе на следующий год какую-нибудь классную цель, к которой можно было бы стремиться в 2026 — прикрепили к посту простой и удобный генератор. Никаких вам новомодных LLM, только подходы, проверенные временем.
14.4K views08:59
Подробнее
Поделиться:
Открыть/Комментировать
30 дек 2025
После выпуска из УрФУ — в Amazon
Так развивалась карьера выпускника Школы анализа данных Макса Шапошникова.

Учебу в магистратуре в УрФУ в Екатеринбурге Макс совмещал с ШАД и с фултайм-работой в финтехе.
Хотя это иногда было непросто, все усилия окупились, когда его пригласили в лондонский офис Amazon. Там он работал в команде, занимающейся технологиями text-to-speech, и довел от идеи до релиза голосовую модель, которая стала частью экосистемы Alexa и сервиса аудиокниг.
После 4 лет в корпорации решил сменить обстановку и ушел в молодой стартап Tessl, где сейчас разрабатывает инструменты для умной кодогенерации.

Тем, кто только начинает карьеру в машинном обучении, он советует как можно раньше пробовать себя в науке и open source, контрибьютить в крупные библиотеки вроде Hugging Face, чтобы собрать портфолио. И, конечно, не забывать про английский и навыки коммуникации – ведь софт-скиллы часто решают, услышат ли вашу идею и дадут ли зелёный свет ее реализации.
13.1K views10:06
Подробнее
Поделиться:
Открыть/Комментировать
26 дек 2025
Праздничный лайфхак, как создать новогоднее настроение и впечатлить коллег
Сделать елку в Excel!

Это красиво, это показывает ваш навык владения одним из лучших продуктов Microsoft и при этом — ни одна реальная елочка от этого не страдает. А если вам безразлична судьба елочек, то вот другой плюс: ее не уронит кот и не придется тащить на мусорку, когда иголки осыпятся.

В общем, сплошные плюсы.

В интернете полно гайдов, как это сделать, но если кратко:
Нарисовать елочку, раскрасив ячейки.
В во все раскрашенные ячейки вставить формулу =СЛУЧМЕЖДУ(1;10), которая возвращает случайное значение в заданном диапазоне.
Выделите вашу елочку, заходите в Условное форматирование Наборы значков и выбирайте там набор из разноцветных кружков. Звезду можно найти, если зайти Вставка Фигуры.
Нажимайте F9, чтобы обновить лист и значения в ячейках. Да, гирлянда тут на ручном управлении.

Готово, вы восхитительны!
10.6K views09:32
Подробнее
Поделиться:
Открыть/Комментировать
25 дек 2025
Государство, вузы и бигтех: кто развивает ИИ-образование в мире?

Этим вопросом задалась команда J'son & Partners Consulting, которая сравнила подходы к подготовке ИИ-специалистов в России, США и Китае. Во всех трех странах ключевой вызов один — образование не успевает за темпами развития технологий, поэтому важно его адаптировать.

Какие меры предпринимают:

В Китае ИИ-образование взяло под свой контроль государство: оно задает стандарты обучения, выделяет финансирование на проекты, направленные на популяризацию технологий искусственного интеллекта, и вводит уроки по работе с ним в школьную программу.

В США ситуация противоположная: за подготовку ИИ-кадров отвечают топовые вузы, обучение в которых может стоить десятки тысяч долларов. Вместо массовости они делают ставку на обучение небольшого числа специалистов очень высокого уровня.

Россия пошла по своему пути: здесь ключевую роль играют бигтехи. Технологические компании совместно с вузами задают ориентиры подготовки ИИ-специалистов. Сегодня обучение развивается в формате партнерских программ — университеты дают фундамент, а бизнес приносит экспертизу в тех областях технологий, о которых еще на написаны учебники. По этой модели, например, запущен бакалавриат AI360 — совместный проект двух ведущих компаний и пяти университетов.

У всех трех моделей есть свои плюсы. Но если у вас стоит выбор STEM-вуза, смотрите и на конкретных партнеров, с кем он делает свои программы.
10.1K views14:46
Подробнее
Поделиться:
Открыть/Комментировать
23 дек 2025
Уже подвели итоги года с ChatGPT?
Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer

Чтобы увидеть свои итоги, просто заходите на chatgpt.com, и он сам предложит их посмотреть.

А если отправить ему эмодзи , то он даже сгенерирует поздравительное видео и выдаст подарок. Виртуальный, конечно, но возможно, более душевный, чем то, что положат коллеги под елочку на «Тайного Санту».

А что у вас в итогах? Делитесь в комментариях.
10.6K views09:34
Подробнее
Поделиться:
Открыть/Комментировать
22 дек 2025
Под капотом управляемой базы данных в MWS Cloud Platform

Building the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.

В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-базы данных: архитектура, работа агентов, механизмы реконсиляции и требования к безопасности.

А также покажет, что именно должен учитывать инженер при разработке и поддержке managed-решений, чтобы они оставались надёжными и безопасными.

Эфир — 25 декабря, 14:00 (МСК)
Среди участников — розыгрыш мерча MWS за лучший вопрос
Регистрация по ссылке
12.4K views09:01
Подробнее
Поделиться:
Открыть/Комментировать
19 дек 2025
Давно у нас пятничных мемов не было. Возвращаем традицию?
12K views11:34
Подробнее
Поделиться:
Открыть/Комментировать
17 дек 2025
GitHub меняет ценовую политику
Сначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на его серверах (надо платить за каждую минуты работы), или собственные, которые пользователь хостит у себя (за них пока не надо платить, но это скоро изменится).

С 1 января 2026 года стоимость использования раннеров, которые хостятся GitHub’ом, снизится до 39% в зависимости от типа машины, на которой они запускаются.
С 1 марта 2026 года будет введена плата $0,002/мин за использование self-hosted раннеров в приватных репозиториях. Взыматься она будет, только если пользователь выйдет за лимит бесплатных минут, предусмотренных его тарифным планом.
Пользователей публичных репозиториев и GitHub Enterprise Server изменения не затронут.

GitHub объясняет эти перемены необходимостью покрыть расходы на поддержание и развитие инфраструктуры. По заверениям компании, для большинства пользователей если что-то и изменится, то исключительно в лучшую сторону. Затраты вырастут только на крупных проектах, быстро расходующих свои бесплатные минуты.
12.7K views09:26
Подробнее
Поделиться:
Открыть/Комментировать
15 дек 2025
Строим витрину данных с Claude через MCP
MCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как начать с ними работу.

В новой статье переходим к практике и показываем, как с помощью Claude создать витрину данных на реальном проекте и с реальными данными. Весь процесс показан по шагам — от старта работы до конечного результата.

Маленький спойлер: не обошлось без сложностей и ошибок, но в итоге даже с учетом правок ИИ справился с задачей в разы быстрее, чем человек.

Читать!
13.1K views11:21
Подробнее
Поделиться:
Открыть/Комментировать
12 дек 2025
Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?
Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.

Да, действительно, и, если вам нужно мониторить изменения в небольшой, не слишком часто обновляющейся таблице, то это отличный вариант. Но дело в том, что все уведомления NOTIFY падают в одну очередь, и если таких уведомлений много, то они затормозят работу всей БД.

Кроме того, их размер ограничен 8000 байтов, чего может быть недостаточно. А еще, если сервис-получатель был по какой-то причине не доступен и сообщение не дошло, повторное через NOTIFY не отправляется — то есть данные просто потеряются.

В общем, не идеальный вариант.

Альтернатива — это настроить Write-Ahead Log или WAL, чтобы получать уведомления из него.

Спойлер: этот вариант тоже не идеальный. Как минимум, придется повозиться:
Изменить wal_level на logical со стандартного replica — так он начнет делать более подробные записи о том, как и что конкретно изменилось в базе.
Создать publications (то есть, расписать, какие таблицы и действия вы хотите отслеживать) и репликационный слот (то есть отдельную копию WAL, которая гарантирует, что никакие важные данные из лога не удалятся, пока уведомление не будет отправлено).
Создать listener, который будет получать уведомления и перенаправлять их дальше — в очередную таблицу, в приложение или мессенджер. Или вообще распечатать.

Но если вам нужно настроить отправку уведомлений и другие способы не подходят, это может быть вполне рабочее решение. Как воплотить его в жизнь, по шагам описано в подробном (очень подробном) гайде.
12.3K views11:35
Подробнее
Поделиться:
Открыть/Комментировать
10 дек 2025
Интернет опять против ИИ-рекламы?
Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную с помощью ИИ.

Герои ролика попадали во всевозможные ужасные ситуации — кто-то упал на льду, а кто-то с крыши, у кого-то кот снес елку и так далее. Все эти душераздирающие события разворачивались под задорную песенку, смысл которой сводился к тому, что праздники — ужасное, стрессовое время и лучше их пересидеть в уютном Макдаке.

Мы говорим о видео в прошедшем времени, потому что с Youtube-канала компании его уже убрали после ужасного фидбека. Пользователи высмеяли и качество картинки, и спорный посыл, и заявления агентства, создавшего видео, о том, как активно команда работала над ним 7 недель:
Мы генерировали то, что было похоже на сырой съемочный материал — тысячи дублей — которые потом монтировали так же, как для любого высокоуровневого продашкена. Это был не ИИ-трюк. Это был фильм.

Заявление уже удалено, но само видео разлетелось по интернету, его все еще можно посмотреть и убедиться, заслуживало ли оно такой жесткой критики.
10.1K views09:36
Подробнее
Поделиться:
Открыть/Комментировать
8 дек 2025
Какие работы на самом деле отнял ИИ?
Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет.

В выборку попали 180 млн вакансий из разных сфер с 2023 по 2025 годы. Автор изучил, как изменилось общее число вакансий (упало на 8%, между прочим), а затем посмотрел на динамику по отдельным должностям и индустриям.

Очевидно, что лучше всего дела у ML-инженеров — у них число открытых вакансий c 2024 по 2025 выросло на 39%.
Хуже всего дела у дизайнеров, копирайтеров и фотографов — число вакансий для них упало на 27-32%. Но только для специалистов, а для креативных директоров и продюсеров предложений так же много, как раньше.
Это общая тенденция — падает спрос на рядовых сотрудников и руководителей среднего звена, а у больших начальников все стабильно.
Без серьезных изменений обходятся сфера продаж, разработка, техподдержка и аналитика. Последнее особенно радует.
В маркетинге стали активнее набирать людей, специализирующихся на работе с инфлюэнсерами. Автор предполагает, что это из-за того, что в эпоху ИИ-слопа уровень доверия к контенту в интернете падает. Компании фокусируются на продвижении через реальных людей, которым их подписчики еще более-менее верят.
Если выйти за пределы привычных ИТ и маркетинга, то просматривается тренд в медицине — стало на 20% меньше вакансий для Medical Scribes. Это такой ассистент, который отвечает за заполнение документов во время приема, чтобы доктор не отвлекался от пациента на бумажки.

А как у вас — замечали какие-то изменения, вызванные распространением ИИ, в вашей сфере?
9.21K views11:06
Подробнее
Поделиться:
Открыть/Комментировать
5 дек 2025
TigerBeetle на практике, или чем хороши узкоспециализрованные тулы
Вы когда-нибудь работали с TigerBeetle?

Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая специализация накладывает ограничения на то, в каких проектах можно использовать TigerBeetle и как вообще с ней работать.

В частности, TigerBeetle заставляет оперировать такими бухгалтерскими понятиями, как дебит, кредит, счета, переводы, и при этом дебит строго не может превышать кредит. И это не просто рекомендация, это на уровне архитектуры БД прописано.

Как это работает на деле?
Вот хороший пример — разработка сервиса по продаже билетов и мерча. Все началось с того, что один инженер просто захотел понять, как это сделать не в теории, а своими руками. На основе он TigerBeetle создал систему, которая позволяет продавать билеты разных из ценовых категорий и мерч.

У каждой группы товаров было три счета:
Operator, в котором был указан весь доступный товар,
Budget, в котором указан остаток товара, доступного для продажи,
Spent, в который записывается проданный товар.

Сначала со счета Operator билеты и футболки движутся в Budget.  Затем, когда пользователь начинает покупку, создается отложенный перевод из Budget в Spent с тайм-аутом в пять минут. Если за это время деньги не поступают, перевод просто удаляется. Но если все ок и платеж проходит, купленный товар окончательно записывается в Spent.

Комбинация из трех счетов не допускает перепродаж — не получится продать больше билетов и мерча, чем есть в наличии. Эта простая, но рабочая демка стала основой для полноценного, жизнеспособного сайта, который может обрабатывать 977 продаж в секунду. Это более чем неплохой результат и демонстрация возможностей TigerBeetle.

Так что, что скажете про БД? Имели с ней дело когда-нибудь или, может, планируете?
10.5K views09:36
Подробнее
Поделиться:
Открыть/Комментировать
4 дек 2025
No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими руками
Даже если вы понятия не имеете, как это делается.

MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объединять их в мультиагентные системы. И все это без знаний программирования. Взаимодействовать с ними можно через мессенджер, чат или API.

Собственно «сборка» проводится в визуальном конструкторе, в котором есть инструменты для подготовки данных, дообучения моделей и мониторинга качества работы.
Платформа поддерживает работу не только с текстом, но и с изображениями и аудио, так что на ней можно будет создать, например, ИИ-агента с голосовым интерфейсом.

А если нет желания создавать ИИ-агента с нуля, можно воспользоваться готовыми решениями. Поскольку платформа — это продукт для бизнеса, в ней сразу содержатся корпоративные копайлоты для HR, клиентской поддержки, программистов, аналитики и общих рабочих задач.

Платформа относится к классу enterprise-ready: разворачивается в закрытом контуре или частном облаке, защищает данные, остаётся независимой от поставщиков и позволяет заменять компоненты или подключать собственные модели.
9.64K views10:47
Подробнее
Поделиться:
Открыть/Комментировать
2 дек 2025
Что такое стратегия Direct-to-Consumer
...и почему не развивать ее — значит проиграть?

Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и геймдев не исключение.

Переход к Direct-to-Consumer — это признак зрелости индустрии, когда люди осознают, что у них два пути. Они могут либо взять управление процессами в свои руки, либо подстраиваться под чужие правила.

Подробнее про эту стратегию и ее плюсы читайте здесь.
4.85K views15:02
Подробнее
Поделиться:
Открыть/Комментировать
1 дек 2025
Что внутри ИИ-стартапа?
А внутри у него Claude или ChatGPT в 70% случаев.

ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. Кроме флагманов OpenAI, появилось и множество компаний поменьше. Они предлагают интегрировать ИИ в рабочие процессы, использовать его для создания контента, написания кода, ведения и упорядочивания заметок, учебы — в общем, для всего подряд.

Довольно часто в описаниях этих ИИ-продуктов можно встретить что-то про «файн-тюнинг», «проприетарные LLM» и другие интересные термины. Они как бы намекают, что компания предлагает какие-то свои собственные технологии или хотя бы доступ к улучшенным, дообученным и докрученным моделям.

Мини-исследование на выборке из 200 стартапов показало, что подавляющее большинство с этим не заморачиваются.

Автор, разработчик ПО и создатель ИИ-систем, на протяжении 3 недель изучал активность 200 ИИ-стартапов. Он промониторил трафик, разобрал и проанализировал из JavaScrist бандлы, а потом сравнил свои выводы с тем, как они сами описывают свой продукт.

73% в своих обещаниях потребителям наврали. Их уникальные ИИ-тулы оказались:
OpenAI API с парочкой промптов (ну хоть их сами написали). У одной из таких компаний автор нашел промпт: «Ты эксперт в (название компании). Всегда отвечай в профессиональной манере. Никогда не упоминай свою связь OpenAI и что ты языковая модель».
OpenAI API с RAG-архитектурой — векторной БД, обычно Pinecone и Weaviate. Уже лучше, хотя ничего уникального и авторского тут нет.
OpenAI API, Claude с библиотекой промптов или модель с HugginFace с LoRA.

Он также привел несколько советов, как отличить честный стартап от тех, кто продает доступ к OpenAI или Claude по оверпрайсу:
Проверить трафик их ИИ-продукта на запросы к api.openai.com, api.anthropic.com или api.cohere.ai.
Засечь скорость ответа. Если он приходит через 200–350 мс, то отвечает, скорее всего GPT-4.
Поискать в бандлах JavaScript openai, anthropic, sk-proj-, claude и cohere.
Внимательно почитать, как разработчики рекламируют свой продукт. Если вы видите много громких слов без деталей и конкретики, это повод напрячься.

Использование готовых моделей — это не всегда красный флаг. Некоторые компании честно признаются, чей ИИ под капотом их продукта. И обычно они продают не сам ИИ, а оптимизацию работы с ним: удобный интерфейс, управление несколькими моделями сразу, грамотно выстроенную RAG-архитектуру. Это все не плохо — плохо врать и называть это «продвинутой проприетарной ИИ-инфраструктурой».
10.9K views08:20
Подробнее
Поделиться:
Открыть/Комментировать
29 ноя 2025
Привет, это Yandex for Analytics

Предлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно

Задача 1. Вспоминаем теорию вероятностей
Задача 2. Теорема Байеса
Задача 3. Базовая база теории игр
Задача 4. Тренируем SQL
Задача 5. Честная математическая статистика
Задача 6. Что-то на бизнесовом

Скоро вернёмся с новыми задачами. А пока делитесь своими решениями в комментариях!

Подписывайтесь:
@Yandex4Analytics
12.6K views08:33
Подробнее
Поделиться:
Открыть/Комментировать
28 ноя 2025
Новое техношоу о фейлах на дата-платформах

Все упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск.

«Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каждому, кто работает с данными. В центре каждого эпизода — один герой и одна яркая история фейла, развернутое обсуждение архитектуры и процессов, а также немного самоиронии.

Анонсы и ссылки на прямые эфиры появятся в телеграм-боте проекта.

Подписывайтесь, чтобы узнавать о премьерах первыми
12K views09:06
Подробнее
Поделиться:
Открыть/Комментировать
26 ноя 2025
Anthropic представила Claude Opus 4.5
Да, это очередная новая модель, которая стала еще умнее, чем предшественницы, еще лучше кодит, размышляет, взаимодействует с агентами и так далее. На картинке к посту — данные ключевых бенчмарков, где видно, насколько Claude Opus 4.5 хорош, хотя и уступает в некоторых категориях конкурентам.

В чем он точно их превосходит — так это в безопасности: он намного менее склонен к «вызывающему опасения» поведению, чем ChatGPT и Gemini, и лучше защищен от промпт-инъекций.

В общем, все как всегда — это все пишут в каждом пресс-релизе, когда выходит новая модель. Из оригинального:
Opus 4.5 оказался слишком умен для некоторых бенчмарков. В τ²-Bench он нашел новое и при этом рабочее решение, которые не было предусмотрено авторами. Из-за этого тест он завалил, но Anthrpoic все равно им гордятся.
У того, что модель получилась такая сообразительная, есть практическая польза для конечного потребителя: она намного эффективнее расходует токены. Opus 4.5 превосходит Sonnet 4.5 и при этом тратит на 76% меньше токенов на те же задачи.
Ну и самое главное — использование Opus 4.5 через Claude API обойдется в $5/$25 за миллион токенов.

В общем, новая модель Anthrpoic стала не только умнее, но и доступнее. Ждем теперь, когда очередную новинку, рвущую все бенчмарки, выкатит OpenAI.
11.6K views11:31
Подробнее
Поделиться:
Открыть/Комментировать
24 ноя 2025
Насколько глубоко ИИ на самом деле проник в повседневную жизнь?
Ответ можно найти в свежем Viz of the Day на Tableau Public — там собраны последние новости и данные про ИИ в разных сферах.

Несколько пунктов оттуда:
В ноябре 2024 объем текстов, написанных ИИ, превысил объем написанных людьми — правда, есть вероятность, что большая часть из них пылится на дне интернета и особого внимания не привлекает.
Написание текстов для рабочих или личных целей — самый популярный запрос пользователей ChatGPT в период с мая 2024 по июнь 2025.
Генерируют не только текстовый контент — в октябре 2025 число запросов к Adobe Firefly, платформе для создания изображений, достигло 29 млрд. Это в 10 раз больше, чем в октябре 2022, когда сервис только запустился.
47% опрошенных пользователей Stack Overflow используют ИИ в работе каждый день, хотя вайб-кодингу 72% сказали твердое нет.

Так что каждый раз, когда вы заходите в интернет, читаете статьи, смотрите на картинки или видео, вероятность, что что-то из этого контента окажется творением ИИ, только растет.
20.9K views11:35
Подробнее
Поделиться:
Открыть/Комментировать
21 ноя 2025
Как выбрать MCP-сервер: практическое руководство
Итак, вы решили использовать ИИ в работе, но не просто мучить ChatGPT вопросами, а сделать все по науке, через MCP-сервер. Осталось только выбрать, какой вам нужен.

Идете в интернет, находите сайт-агрегатор или подборку серверов и видите там сотни вариантов. Если вам нужно подключить ИИ к какому-то популярному инструменту — например, к PostgreSQL, то в поисковой выдаче на вас вывалится несколько страниц результатов.
Чем они все друг от друга отличаются?
Что надо учитывать при выборе?
Какой MCP-сервер лучше — специализированный под узкий спектр задач или универсальный?
А может, вы вообще не знаете пока, что такое MCP-сервера и где они водятся?

На эти вопросы отвечаем в нашей новой статье на Хабре!
21.3K views11:34
Подробнее
Поделиться:
Открыть/Комментировать
19 ноя 2025
Нейроаналитик DataLens: ваш ключ к данным
О чем чаще всего просят аналитиков?

«Да просто объясни, что эти данные значат? Что мне с ними делать?» Пользователь хочет увидеть руководство к действию и ответы на свои вопросы, а не сложные дашборды, где еще с фильтрами и гранулярностью надо разбираться.

А что, если мы скажем, что уже есть такой помощник, который может сделать данные ближе и понятнее? Это — Нейроаналитик от DataLens.

И если вы до сих пор не познакомились с ним — вы упускаете один из самых элегантных способов общаться с вашими цифрами.

Как это работает? По-человечески
Представьте, что вы можете спросить у системы так же, как спросили бы у коллеги: «Покажи, как изменилась выручка в этом месяце» или «Сравни конверсию по регионам». В ответ Нейроаналитик не просто построит график, а сформулирует выводы и предоставит краткий отчет.

Что он умеет?

Отвечать на вопросы текстом. Спросите: «Почему просели продажи в мае?» — и получите готовый анализ с выводами.
Создавать и дорабатывать кастомные визуализации в Editor.
Генерировать сложные вычисляемые поля простым текстом. Просто опишите, какую метрику нужно рассчитать (например, «рентабельность по кампаниям»), и помощник создаст формулу за вас.
Находить скрытые связи. Автоматически сканирует данные и предлагает инсайты, о которых вы могли и не подумать.

Важно учитывать, что это не замена аналитикам, а помощник и для дата-специалистов, и для бизнес-заказчиков. Вот, что про это думает основатель LEFT JOIN Николай Валиотти:
Конечно, обычные аналитики никуда не денутся — за кодом, SQL-запросами, дашбордами, всей дата-инфраструктурой и так далее все равно должен стоять человек, который это все контролирует и настраивает. Но сервисы вроде Нейроаналитика и не должны никого заменять. Они нужны для случаев, когда у пользователя есть короткий, конкретный вопрос и он хочет получить короткий, конкретный ответ. Попробуйте Нейроаналитик в действии — задайте свой первый вопрос в DataLens и посмотрите, как просто может быть работа с данными.
Реклама. ООО Яндекс.Облако. ИНН 7704458262
5.31K viewsedited  15:26
Подробнее
Поделиться:
Открыть/Комментировать
17 ноя 2025
Как когнитивные искажения убили стартап
Вы когда-нибудь слышали про приложение Takkle?

Скорее всего, нет. Это была американская социальная сеть со спортивным уклоном. Takkle давно схлопнулась, и от нее остались только старые аккаунты в Twitter и на Youtube. Но ее недолгая история довольно любопытна.

Что случилось с Takkle, и почему это должно быть интересно?
По воспоминаниям бывшего VP по инжинирингу, одна из причин провала — это неудачное решение CTO еще на этапе разработки. Старый СТО уволился, а новый, пришедший ему на смену, сказал, что PHP никуда не годится и надо срочно все переписывать на Perl. Это был опытный специалист с серьезным резюме, который провел анализ, привел аргументы и в итоге всех убедил.

Плюсом перехода стало то, что команда создала действительно выдающийся проект на Perl, которым можно гордиться. Минусами стало то, что им пришлось нанять больше людей в команду, расходы выросли, а разработка затянулась. За это время их главный конкурент, который принадлежит признанной экстремистской организации, окончательно захватил рынок. Хотя Takkle все же запустилась и какое-то время просуществовала, наверстать упущенное она так и не могла.

Сейчас сложно судить, какой могла бы быть ее судьба. Может быть, она точно так же канула бы в Лету через пару лет, а может, смогла бы найти свою нишу и вырасти во что-то большее.

Но главное то, что на грабли Takkle компании наступают чаще, чем кажется. Да, не все станут переписывать проект на полпути, но многие дорогостоящие решения важных людей нередко принимаются по наитию, на эмоциях или... на хайпе.

(Ир)рациональный выбор
Решение нового СТО Takkle казалось очень даже рациональным и обоснованным: он проанализировал плюсы и минусы и даже провел презентацию. Но все эти телодвижения нужны были не для того, чтобы реально разобраться в вопросе, а чтобы обосновать уже принятое решение.

То есть СТО и не думал серьезно сравнивать PHP и Perl. Он уже решил, что надо переходить на Perl, и просто хотел перетянуть на свою сторону остальных.

Такая преданность ЯП или тулу (например, БД, BI-системе и так далее) у некоторых специалистов превращается в когнитивное искажение. Они уверенны, что их выбор самый лучший и оптимальный, и даже не рассматривают альтернативы. Это мешает принимать решения рационально и может дорого обойтись компании — как это было с Takkle.

Автор пришел к выводу, что надо вообще уходить от обсуждения «какой язык самый лучший» и все переводить в деньги: считать, сколько будет стоить разработка, поддержка, дальнейшее развитие проекта. Кажется, что это мысль очевидная, но практика говорит об обратном.

А что вы думаете? Сталкивались с похожими кейсами?
20.2K viewsedited  10:31
Подробнее
Поделиться:
Открыть/Комментировать
14 ноя 2025
Вайб-кибершпионаж
Уже был и вайб-кодинг, и вайб-инжиниринг, а вот теперь — вайб-кибершпионаж с помощью ИИ.

Anthropic рассказали про операцию некой преступной группировки из Китая, которая пыталась использовать Claude для атаки на крупные технологические компании, финансовые и государственные учреждения. Злоумышленников уже остановили, а пострадавших оповестили.

Как проходила операция?
Главной задачей для человека было убедить Claude заняться взломом. Чтобы обойти внутренние ограничения ИИ, ему давали небольшие, на первый взгляд безобидные задания, чтобы он «думал», будто участвует в тестировании системы безопасности.

Это был первый этап атаки. На втором Clause изучал ИТ-инфраструктуру жертвы, чтобы найти, где хранятся самые ценные данные. Затем он искал слабые места в системе безопасности, собирал логины и пароли, создавал бекдоры. А в конце еще и писал документацию «проекта» с описанием инфраструктуры и украденными доступами. Интересно, что иногда он галлюцинировал и просто выдумывал эти доступы. Все это — с минимальным участием человека:
В целом злоумышленники смогли переложить на ИИ 80–90% всей кампании, участие человека требовались лишь эпизодически (для принятия 4–6 ключевых решений на каждую кампанию).

Современный ИИ достаточно умен, чтобы справляться со сложными техническими задачами, причем, намного быстрее человека. А еще способен действовать как агент практически автономно и получать доступ к различным инструментам через MCP — это все и позволило преступникам свалить на него всю работу.

Anthropic заявляют, что из всей операции только небольшой процент атак оказались успешными, но предупреждают, что масштаб подобных операций — и заодно урон — будут только расти. Чтобы обезопасить себя от ИИ-атак, компаниям предлагают вкладываться в ИИ-защиту.
17.5K viewsedited  09:35
Подробнее
Поделиться:
Открыть/Комментировать
12 ноя 2025
OR или не OR?
Представим, что у вас есть большая таблица applications, в которой хранятся данные о заявках пользователей, а также о людях, которые их подают (они указаны в столбце submitter_id) или рассматривают (reviewer_id). Вам нужно посчитать, со сколькими заявками взаимодействовал пользователь — неважно, отправлял или рецензировал.
Какой запрос, на ваш взгляд сработает быстрее?
SELECT COUNT(*)
FROM application
WHERE submitter_id = :user_id
OR reviewer_id = :user_id;
или
SELECT (
SELECT COUNT(*) FROM application WHERE reviewer_id = :user_id
)
+ (
SELECT COUNT(*) FROM application WHERE submitter_id = :user_id
)
- (
SELECT COUNT(*) FROM application WHERE submitter_id = :user_id
AND reviewer_id = :user_id
);

Первый вариант выглядит изящнее, да и логичнее — зачем расписывать сложную конструкцию с подзапросами, когда можно обойтись 4 строками. Но при этом второй запрос выполнится почти в 100 раз быстрее. Пруф.

По той же ссылке есть объяснение, почему так получается, но если кратко:
Оператор AND уменьшает выборку данных, а индексы и статистика БД помогают оптимизировать его выполнение. Когда вам нужно отобрать данные по двум условиям, движок ищет сначала ищет записи, где выполняется более редкое условие и затем проходится по второму.
Оператор OR либо последовательно проходится по всем данным в таблице, либо целиком одной колонке, затем по второй, чтобы их объединить. Оба варианта более «дорогие», чем просто просканировать столбец и отфильтровать лишнее

Так что если вы замечаете, что запросы с OR слишком долго выполняются, то имеет смысл их переписать — пусть будут не такие красивые, зато более эффективные. Например, для кейсов, как в начале поста автор рекомендует задуматься о создании «дочерней» таблицы:
CREATE TABLE application_user (
user_id int8 NOT NULL,
application_id int8 NOT NULL,
user_type enum('submitter','reviewer') NOT NULL
);

И свой изначальный запрос переделать через JOIN:
SELECT * FROM application a
JOIN application_user au USING (application_id)
WHERE au.user_id = :user_id;
Это все не повод отказываться от использования OR совсем и в любой непонятной ситуации создавать и джойнить новые таблицы. Но особенности этого оператора стоит иметь в виду, особенно, когда вы работаете с большими объемами данными.
16K views10:46
Подробнее
Поделиться:
Открыть/Комментировать
10 ноя 2025
Ваш PostgreSQL больше читает или пишет?
Одна из причин, почему Postgres так популярен — это его универсальность и гибкость. Мало того, что он прекрасно встроится почти в любой проект, так еще и можно оптимизировать и докрутить под свои запросы, чтобы поднять и без того высокую производительность.

Как именно его оптимизировать и докручивать, зависит от совокупности факторов, среди которых — то, каким операциям отдается приоритет: чтению или записи.

Социальные сети, новостные сайты, интернет-магазины, в общем, все, где люди больше листают, чем что-то активно делают — это проекты, где больше приходится читать. Финансовые приложения, системы, которые отслеживают какие-то события на сайте или собирают данные для аналитики — это больше про постоянную запись новой информации в базу. А еще есть смешанные варианты, например, мессенджеры или CRM-системы, где пользователь и запрашивает данные, и вносит их сам со сравнимой частотой.

Операции чтения и записи «стоят» неодинаково — вторые дороже, сложнее и дольше. Следовательно, если оптимизировать PostgreSQL под свой проект, то это надо учитывать.
Так, там, где больше чтения, принципиальна скорость, чтобы обеспечить пользователю максимально быстрый доступ к информации, которую он ищет. А это оптимизация индексов, кэширования и «тяжелых» SQLзапросов.
А там, где нужно больше делать новые записи, важнее обеспечить вычислительные мощности, быстрое хранилище и большой объем оперативки, а еще не злоупотреблять индексами.

Нашли для вас полезную инструкцию, как разобраться, к какой категории относится ваш проект, и что еще можно сделать с вашим Postgres, чтобы он работал быстрее.
18K views10:33
Подробнее
Поделиться:
Открыть/Комментировать