Получи случайную криптовалюту за регистрацию!

Dan Okhlopkov - канал

Логотип телеграм канала @danokhlopkov — Dan Okhlopkov - канал D
Логотип телеграм канала @danokhlopkov — Dan Okhlopkov - канал
Адрес канала: @danokhlopkov
Категории: Блоги
Язык: Русский
Количество подписчиков: 8.90K
Описание канала:

а кто этот твой друг русский хакер, поднявший деньги от наваля
okhlopkov.com

Рейтинги и Отзывы

1.00

2 отзыва

Оценить канал danokhlopkov и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

0

2 звезд

0

1 звезд

2


Последние сообщения 49

2021-04-12 19:29:24 я выступаю через час есчо
399 views16:29
Открыть/Комментировать
2021-04-12 19:25:04
Мой доклад будет поверхностным и быстрым - я просто вкину технологии, которые помогут вам быстро собрать Data Platform для вашего проекта. Будет максимально приближено к практике, но самому погуглить детали нужно anyway.

Для маленьких стартапов, для маленьких данных, для будущих CTO.
449 viewsedited  16:25
Открыть/Комментировать
2021-04-12 13:00:16 Каггл и корпорации извратили нас, предлагая готовые датасеты для анализа. А собирать их кто будет? Где хранить и как предоставить доступ для аналитиков и пацанам из бизнеса?

Сегодня где-то после 20:00 расскажу, как дешево сделать платформу по сбору, хранению и анализу данных для вашего стартапа. Не биг-бигдата, но для ~1Тб данных подойдет. Ссылочка.
489 views10:00
Открыть/Комментировать
2021-04-09 14:28:01 ETL vs. ELT

До меня только недавно дошло, что такое ELT и зачем. Раньше я думал, что это опечатка или прикол а-ля HODL. Но нет.

Когда ты дата инженер, тебе нужно перетаскивать данные из одного места в другое. Бывает, что ты добавляешь новый источник данных в свой Data Lake (например, начинаешь парсить что-то).

Так вот, в этом случае правильным и масштабируемым подходом будет ELT (extract-load-transform), а не ETL (extract-transform-load). Лучше сохранять максимально сырые данные (+ timestamp), а потом отдельной таской переводить их в нужный формат в новую таблицу.

Да, занимает больше места (хранение сырых и обработанных данных), дольше прогать (нужно писать скрипт, форматирующий данные). Но в будущем, когда окажется, что нужно было что-то ещё сохранять или форматирование было ошибочное, вы всегда сможете все переделать без потерь данных, так как у вас сохранены исходники.
554 views11:28
Открыть/Комментировать
2021-04-06 11:49:12 SQL + Python = Сила
1.1K views08:49
Открыть/Комментировать
2021-04-05 12:31:30 Квест

1) Расклеиваем QR коды в городе
2) Коды - одноразовые
3) Первому выдается NFT токен с местом
4) Заводим комьюнити, кидаем туда подсказки
5) Заводим сайт с картой, лидербордом и тп.
1.3K views09:31
Открыть/Комментировать
2021-04-05 09:47:01 Раз я люблю парсить открытые данные (кстати не факт, что это все еще можно делать), у меня была идея сделать поисковик по людям.

Формально просто парсить профили людей в разных соцсетях (Instagram, Facebook, Twittter, Linkedin, Telegram, Github). Объединять профили из разных соцсетей в одного человека. По UGC определять интересы, связи с другими людьми, демографию и гео. Внутри сервиса предлагать поиск по этим фильтрам, а на выходе давать ссылки на соцсети.

Такая вот read-only соцсеть получается. Начать можно с айтишников, так как о них можно больше инфы нарыть.
395 views06:47
Открыть/Комментировать
2021-04-01 15:50:00 Местоположение всех нод Ethereum (~4300 штук)
707 views12:50
Открыть/Комментировать
2021-04-01 14:55:44 Местоположение всех биткойн нод (~8800 штук)
793 viewsedited  11:55
Открыть/Комментировать